Python全系列 教程
3567个小节阅读:5931.2k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
AD+LR(逻辑回归)版本
xxxxxxxxxx
321from scipy import sparse
2from sklearn.preprocessing import OneHotEncoder
3from sklearn.linear_model import LogisticRegression
4
5# 加载数据
6train = pd.read_csv("data/train.csv")
7test = pd.read_csv("data/test.csv")
8ad = pd.read_csv("data/ad.csv")
9
10train = pd.merge(train,ad,on="creativeID") # 根据"素材ID"合并train与ad
11test = pd.merge(test,ad,on="creativeID") # 根据"素材ID"合并test与ad
12y_train = train["label"].values # 获取训练数据集的标签
13
14# 特征工程
15enc = OneHotEncoder()
16feats = ["appID","appPlatform"] # 对这些特征进行one-hot编码
17
18
19# fit_transform:这个方法用于在训练数据上拟合模型并对数据进行转换
20x_train = enc.fit_transform(train[feats])
21# 这个方法用于在已经拟合(fit)了模型的情况下,对新的数据进行转换
22x_test = enc.transform(test[feats])
23# 逻辑回归模型训练
24# 增大迭代次数 max_iter:最大迭代次数
25# solver:优化算法 sag 是一种随机梯度下降(SGD)的变种,专门用于逻辑回归问题。
26
27import warnings # 忽略警告 warning.filterwarnings("ignore")
28lr = LogisticRegression(solver='sag')
29lr.fit(x_train,y_train) # 训练模型
30proba_test = lr.predict_proba(x_test)[:,1] # 预测概率
31proba_test
32
提示
它的主要特点是每次只使用一个样本来估计梯度,而不是使用整个训练集,这可以加速收敛过程。
SAG 算法通常用于处理大型数据集,因为它在每个迭代步骤中只需要计算一个样本的梯度,从而降低了计算成本。