目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

Python全系列 教程

3567个小节阅读:5930.6k

收藏
全部开发者教程

鸿蒙应用开发

C语言快速入门

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(646)
赞(0)

特征工程之特征选择

image-20220615102828465

选择有效的特征

image-20220615103430976

在Kaggle竞赛中,经常采用这样的方法选择有效特征:如果当加入某个特征后模型的表

现很好,而去掉该特征后模型表现不好,则应该保留该特征。

基于统计值的特征选择

  • 字段方差(方差大,则包含的信息量大)
  • 缺失值比例
  • 分布一致性
  • 离群点
  • 特征与标签相关性

基于模型的特征选择

  • 线性模型:coef_

  • 树模型:feature_importances_

    • 根据字段在节点分裂的信息增益或基尼指数
    • 根据字段被分裂次数,字段分裂平均深度
  • Permutation importance

将特征随机打散后计算模型精度的差异,并将精度变化作为特征重要性

image-20220615104549338

  • Null importance

将标签多次乱序后,对比原始特征与打乱标签后的特征重要性

image-20220615104940686

如上图,右边的两张图说明对应的特征与标签强相关

 

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2