Python全系列 教程
3567个小节阅读:5930.7k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
当前经济增速下行,风控压力加大,各家商业银行纷纷投入更多资源拓展信用卡业
务,信用卡产业飞速发展。因为市场竞争激烈,信用卡产品同质化严重,商业银行需要采
用更快捷有效的方式扩大客户规模,实现精准营销,从而降低成本提高效益,增强自身竞
争力。
x# 读取数据
import pandas as pd
df = pd.read_excel('信用卡精准营销模型.xlsx')
# 解决用Pandas处理csv,excel文件多出unnamed列问题
df = df.loc[:, ~df.columns.str.contains('Unnamed')]
df.head()
# 划分特征变量和目标变量
X = df.drop(columns='响应')
y = df['响应']
# 划分训练集和测试集
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=123)
# 模型训练
from sklearn.ensemble import AdaBoostClassifier
clf = AdaBoostClassifier(random_state=123)
clf.fit(X_train, y_train)
# 模型评估
y_pred = clf.predict(X_test)
print(y_pred)
# 查看预测准确度
from sklearn.metrics import accuracy_score
score = accuracy_score(y_test,y_pred)
print(score)
# 查看预测分类概率
y_pred_proba = clf.predict_proba(X_test)
# 查看前5项,第一列为分类为0的概率,第二列为分类为1的概率
print(y_pred_proba[:5])
# 查看AUC值
from sklearn.metrics import roc_auc_score
score = roc_auc_score(y_test, y_pred_proba[:,1])
print(score)
# 查看特征重要性
print(clf.feature_importances_)
# 通过DataFrame的方式展示特征重要性
features = X.columns # 获取特征名称
importances = clf.feature_importances_ # 获取特征重要性
# 通过二维表格形式显示
importances_df = pd.DataFrame()
importances_df['特征名称'] = features
importances_df['特征重要性'] = importances
importances_df.sort_values('特征重要性', ascending=False)
1. 解决用Pandas处理excel文件多出包含Unnamed字样列问题,正确的代码是:
A df.loc[:, ~df.columns.str.contains('Unnamed')]
B df.drop(columns='Unnamed')
C train_test_split
D accuracy_score
2. 使用AdaBoostClassifier对象查看特征重要性的属性是_______:
A coef_
B intercept_
C feature_importances_
D columns
1=>A 2=>C