目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

Python全系列 教程

3567个小节阅读:5930.3k

收藏
全部开发者教程

鸿蒙应用开发

C语言快速入门

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(679)
赞(0)

Home Credit Default Risk赛题

image-20220615200054890

赛题背景

金融信贷用户风控:利用电信和交易信息,使用机器学习算法来预测客户的还款能力

  • 字段聚合
  • 树模型
  • 目标编码

赛题评价指标

  • 分类问题,使用AUC进行评价
  • 对于测试集数据,需要预测标签具体的概率值

赛题数据:信贷数据、用户消费数据

image-20220615192712031

赛题数据页面:https://www.kaggle.com/competitions/home-credit-default-risk/data

各个文件的字段含义在HomeCredit_columns_description.csv 中都有介绍

application_{train|test}.csv文件字段含义整理如下:

image-20220621114728230

image-20220621114809597

image-20220621114832467

赛题思路

赛题建模:多表多字段,结构化数据

  1. 步骤1:理解赛题字段的含义,以及多表之间的关系
  2. 步骤2:对字段进行分类,理解字段的含义
  3. 步骤3:聚合多表特征,构建新特征,训练模型
Home_Credit_Default_Risk数据分析(一) SPSS概述

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2