Python全系列 教程
3567个小节阅读:5929.8k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
交叉验证是一种模型选择方法和调参方法,它随机地将数据集切分成三部分,分别为训
练集(training set)、验证集(validation set)和测试集(test set)。训练集用来训练模型,验证
集用于模型的选择,测试集用于最终对学习方法的评估。
首先随机地将已给训练数据集切分为k个互不相交的大小相同的子集;然后利用K-1个子
集的数据训练模型,利用余下的子集验证模型;将这一过程对可能的K种选择重复进行(这
一过程使用的是同一组超参数);最后通过计算K次的预测误差,对其平均便会得到1个交
叉验证误差(也就是这一组超参数的预测误差或成绩)。
留一交叉验证(留一法)是K折交叉验证的特殊情形,即:K=N,这里N是给定训练数
据集的容量。
留一法不受随机样本划分方式的影响,最接近模型真正的性能指标。因为N个样本只有
唯一的方式划分为N个子集——每个子集包含一个样本。
缺点:计算量巨大
1. 关于交叉验证,下列说法正确的是:
A 交叉验证是一种回归算法
B 交叉验证将数据集分为训练集与测试集
C 交叉验证的验证集用于最终对学习方法的评估
D 交叉验证是一种模型选择方法,它随机地将数据集切分成训练集、验证集、测试集
2. 关于K折交叉验证,下列说法正确的是:
A 将测试数据集切分为k个子集
B 使用K-1个子集进行测试模型
C 当K=N(N为给定训练数据集的容量)时,即为留一交叉验证
D 以上说法均不正确
1=>D 2=>C