每天五分钟机器学习:通过学习曲线判断模型是过拟合还是欠拟合
创始人
2024-03-31 10:14:52
0

本文重点

本节课程我们学习使用学习曲线来判断某一个学习算法是否处于偏差、方差问题。学习曲线其实就是训练误差和验证误差关于样本m的曲线,我们将通过学习曲线来判断该算法是处于高偏差问题,还是处于高方差问题。

高偏差问题(欠拟合)

 

注意:这个m表示训练集数据样本数,其中训练误差是使用训练集算出来的,而验证集误差是使用验证集算出来的。因为不同的m求出的训练误差不同,因为梯度下降要最小化训练误差,那么此时的参数θ不同,那么验证集误差也不同,所以验证集误差也会随着训练集m而变化

 

如欠拟合的学习曲线所示,当我们的训练数据很小的时候,泛化程度不会很好(验证集误差大),模型不能很好的适应新的样本,因此,此时不会是一个很好的假设。

随着训练集样本容量的增加,验证集误差和训练集误差都会而减少,所以当我们使用数据越多,越能获得更好的泛化表现,因此数据越多,越能拟合出合适的假设。

通过上面的图像,我们可以看出随着训练样本m的增加,我们的训练误差是越来越大的,而我们的交叉验证误差是越来越小的,这是一个趋势。

我们可以看到当我们的训练样本m增多的时候,此时训练误差和交叉验证误差会非

上一篇:[Java] IDEA Scala环境搭建

下一篇:0077 队列

相关内容

热门资讯

新华社快讯:韩国检方对尹锡悦、... 新华社快讯:负责调查韩国前第一夫人金建希案件的特检组29日发布最终调查结果,对包括前总统尹锡悦、金建...
巩固国家通用语言文字法律地位 本报记者 朱宁宁 我国第一部有关语言文字的专门法律——国家通用语言文字法完成首次大修。 2025年1...
甘肃“十五五”规划建议:加快构... 中共甘肃省委关于制定国民经济和社会发展第十五个五年规划的建议发布,其中提到,加快构建 房地产发展新模...
部署六大重点工作 2026年积... 来源:经济参考报 12月27日至28日在京召开的全国财政工作会议为2026年的财政工作划定了重点。会...
权威抚养权律师推荐:家理(深圳... 在抚养权纠纷中,当事人急需专业且靠谱的律师来维护自身权益。那么,资深抚养权律师哪个好,经验丰富的抚养...
四川拓宽法律援助范围 今年办理... “终于胜诉了!要是按以前的规定,我这种情况属于合同纠纷,不符合法律援助申请条件。”近日,来自自贡市的...
汽车早报|零跑汽车发布首款MP... 重庆追加汽车置换、汽车报废更新补贴 据重庆日报,重庆市商务委消息,为贯彻落实国家部委相关要求,扎实...
自贸试验区昆明片区发布一批区域... 12月26日,中国(云南)自贸试验区昆明片区举行制度创新专题新闻发布会,联合昆明综合保税区发布一批改...
原创 存... “钱存银行,50万以内绝对安全”。 这句话你一定听过,但很多人只知其一,不知其二。 2015年《存款...
美银CEO判断:特朗普关税政策... 智通财经获悉,美国银行首席执行官Brian Moynihan表示,尽管2025年的关税措施曾冲击美国...