Python全系列 教程
3567个小节阅读:5929.7k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
数据来自于UIC数据集中的能效数据集,该数据集用来分析建筑的供热负荷能效和制冷负荷能效,其中自变量有8个,主要分析8个自变量和供热负荷Y1之间的回归模型
根据效能数据绘制数据相关系数热力图,并建立回归模型,并检测模型准确率
xxxxxxxxxx
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
import seaborn as sns
from sklearn import datasets
import pandas as pd
# 解决绘图中文乱码问题
plt.rcParams['font.sans-serif'] = ['SimHei']
# 解决绘图负号问题
matplotlib.rcParams['axes.unicode_minus']=False
# 设置绘图字体
sns.set(font= "Kaiti",style="ticks",font_scale=1.4)
# 读取用于多元回归的数据
enbdf = pd.read_excel("ENB.xlsx")
# 对每个变量的取值进行标准化
enbdf_n = (enbdf-enbdf.mean())/enbdf.std()
enbdf_n.head()
# 使用相关系数热力图可视化变量之间的相关性
datacor = enbdf_n.corr()
# 热力图可视化相关系数
plt.figure(figsize=(8,8))
# annot参数:默认为False,为True的话,会在格子上显示数字
ax = sns.heatmap(datacor,square=True,annot=True,fmt=".2f",
linewidths=.5,cmap="YlGnBu")
ax.set_title("数据变量相关性")
plt.show()
X = np.array(enbdf_n)[:,:-1] # 样本特征
y = np.array(enbdf_n)[:,-1] # 样本标签
from sklearn.model_selection import train_test_split
# 拆分数据集
X_train,X_test,y_train,y_test = train_test_split(X,y,random_state=666)
from sklearn.linear_model import LinearRegression
lin_reg = LinearRegression()
lin_reg.fit(X_train,y_train) # 使用训练集拟合模型
print(lin_reg.score(X_test,y_test)) # 使用测试集测试模型的优劣
1.计算特征的相关系数,使用DataFrame的哪个方法:
A corr()
B mean()
C count()
D 以上均不正确
2.绘制相关系数热力图,使用seaborn中的哪个方法:
A plot()
B heatmap()
C scatterplot()
D 以上均不正确
1=>A 2=>B