Python全系列 教程
3567个小节阅读:5930.6k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
在进行每一笔股票交易的时候,交易者(股民)都是要付给开户所在的证券公司一些手
续费的,虽然单笔交易的手续费并不高,然而股票市场每日都有巨额的成交量,使得每一笔
交易的手续费汇总起来的数目相当可观,而这一部分收入对于一些证券公司来说很重要,甚
至可以占到所有营业收入50%以上,因此证券公司对于客户(也即交易者)的忠诚度和活跃
度是很看重的。
如果一个客户不再通过该证券公司交易,也即该客户流失了,那么对于证券公司来说便
损失了一个收入来源,因此证券公司会搭建一套客户流失预警模型来预测交易者是否会流
失,从而对于流失概率较大的客户进行相应的挽回措施,因为通常情况下,获得新客户的成
本比保留现有客户的成本要高的多。
读取数据
划分特征变量和目标变量
划分训练集和测试集
模型训练
查看模型预测准确率
模型使用
x# 1.读取数据
import pandas as pd
df = pd.read_excel('股票客户流失.xlsx')
df.head()
# 2.划分特征变量和目标变量
X = df.drop(columns='是否流失')
y = df['是否流失']
# 3.划分训练集和测试集
from sklearn.model_selection import train_test_split
# 设置random_state使得每次划分的数据一样
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1)
# 4.模型训练
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X_train, y_train)
# 5.查看模型预测准确率
model.score(X_test, y_test)
# 6.模型使用1 - 预测数据结果
y_pred = model.predict(X_test)
print(y_pred[:100]) # 打印预测内容的前100个看看
# 模型使用2 - 预测股票客户流失概率
y_pred_proba = model.predict_proba(X_test)
print(y_pred_proba[:5]) # 打印前5个客户的分类概率
# 只查看流失的概率(也即y=1概率,即上面二维数组的第二列)
print("股票客户流失概率:",y_pred_proba[:,1])
1. 关于股票客户流失预警的业务,下列说法正确的是:
A 进行股票交易的时候,股民无需付给开户证券公司手续费
B 交易手续费只占证券公司营业收入很小的一部分
C 获得新客户的成本比保留现有客户的成本要高的多
D 以上说法均不正确
2. 使用LogisticRegression预测概率的方法是_______:
A predict()
B predict_proba()
C fit()
D score()
1=>C 2=>B