Python全系列 教程
3567个小节阅读:5929.9k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
xxxxxxxxxx
71# 通过散点图查看变量之间关系:身高与体重
2df.plot(kind='scatter',x='身高',y='体重')
3# # 身高和评分之间的关系
4df.plot(kind='scatter',x='身高',y='评分')
5#使用相关系数描述身高和体重之间的关系
6df['身高'].corr(df['体重'])
7df['身高'].corr(df['评分'])
【示例】与评分相关性强的指标有哪些
xxxxxxxxxx
41# 筛选和评分相关性的数据
2# df3.select_dtypes(include=['number']).corr()['评分']
3# 筛选和评分相关性的数据,比较强的前10个指标
4df3.select_dtypes(include=['number']).corr()['评分'].sort_values(ascending=False).head(10)
【示例】年龄与评分是否相关
xxxxxxxxxx
121# 查看评分和年龄的相关性
2df3.plot.scatter(x='年龄',y='评分')
3# 对年龄进行分组
4pd.cut(df3['年龄'],bins=4,labels=['青年','中年','壮年','老年'])
5# 将切分好的数据,添加到原来的数据中
6df3['age'] = pd.cut(df3['年龄'],bins=4,labels=['青年','中年','壮年','老年'])
7# 按照年龄分组,查看评分的情况
8df3.groupby('age')['评分'].mean()
9# 通过图表,按照年龄分组,查看评分的情况
10df3.groupby('age')['评分'].mean().plot(kind='line')
11# 按照年龄分组,指定分组的边界
12pd.cut(df3['年龄'],bins=[10,30,40,50],labels=['青年','中年','壮年'])