Python全系列 教程
3567个小节阅读:5931.2k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
在Kaggle竞赛中,经常采用这样的方法选择有效特征:如果当加入某个特征后模型的表
现很好,而去掉该特征后模型表现不好,则应该保留该特征。
线性模型:coef_
树模型:feature_importances_
Permutation importance
将特征随机打散后计算模型精度的差异,并将精度变化作为特征重要性
将标签多次乱序后,对比原始特征与打乱标签后的特征重要性
如上图,右边的两张图说明对应的特征与标签强相关
1. 关于特征选择,下列说法正确的是:
A 字段值的方差大,则包含的信息量小,说明该特征不重要
B 如果字段的缺失值比例过大,则需要保留该特征
C 如果某特征与标签相关性很大,则需要保留该特征
D 如果特征的分布不一致,则需要保留该特征
2. 关于Permutation importance,下列说法正确的是:
A 将特征随机打散后计算模型精度的差异,并将精度变化作为特征重要性
B 将标签多次乱序后,对比原始特征与打乱标签后的特征重要性
C 通过观察特征的存在与否影响模型的精确度的差异来决定是否选择该特征
D 以上说法均不正确
1=>C 2=>A