Python全系列 教程
3567个小节阅读:5930.4k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
在Pandas中,cut()
方法用于将连续变量划分为离散的分箱
它可以根据指定的分箱边界将数据划分为不同的区间,并为每个区间分配一个离散的标签
提示
- 在构建评分卡模型、风险评估等场景中,分箱是一种常用的方法,用于将连续变量映射为离散评分或风险等级
- 在数据分析和探索性数据分析(EDA)中,将连续变量进行分箱可以更好地理解数据的分布特征和趋势
xxxxxxxxxx
pd.cut(x, bins, labels=None, right=True, include_lowest=False)
x :要进行分箱的连续变量
bins :指定分箱的边界
right = True :表示分箱边界的包含情况,True表示包含右边界,False表示不包含右边界
labels = None :用于为每个区间指定离散标签
include_lowest = False :表示是否包含最小值的区间
xxxxxxxxxx
pd.qcut(x,q)# 按均值取值范围进行等分
xxxxxxxxxx
#按均值取值范围进行等分
df['cut1'] = pd.qcut(df.身高,q=5)
#自定义分段
df['cut2'] = pd.cut(df.身高,bins=[150,160,170,180,190],right=False)
实时学习反馈
1. Pandas中对数值变量分段,按均值取值范围进行等分的方法是_____:
A qcut()
B cut()
2. Pandas中根据身高值进行分段,下划线处分别需要填写的代码是_____:
xxxxxxxxxx
df = pd.read_excel('stu_data.xlsx')
# 对身高进行分段,分为150,160,170,180,190
df['cut2'] = pd.cut(________,________,right=False)
A df bins=[150,160,170,180,190]
B df.身高 bins=[150,160,170,180,190]
答案
1=>A 2=>B