登录注册写文章

机器学习-正则化

机器学习-正则化

正则化：简单性

过拟合通过降低复杂模型的复杂度来防止过拟合，这种原则称为正则化
也就是说，并非只是以最小化损失（经验风险最小化）为目标，而是以最小化损失和复杂度为目标，这称为结构风险最小化
minimize(Loss(Data|Model)+complexity(Model)
因此，现在训练优化算法要考虑到两方面的因素，一个是Loss 一个是正则化项，
模型复杂度具体如何衡量呢？
其实有两种方法
将模型复杂度作为模型中所有特征的权重的函数
将模型复杂度作为非零权重的特征总数的函数
比如L2正则化公式：
L2=w1^2 +w2^2....wN2
用此来衡量模型复杂度，通常接近于0的权重，对模型复杂度几乎没有什么影响，而离群权重则可能会产生巨大的影响

正则化项乘以名为lambda（正则化率）的标量

minimize(Loss(Data|Model)+……𝝀complexity(Model)
执行L2正则化对模型会产生以下影响：
使权重接近于0
使权重的平均值接近于0 且呈正态分布
在选择 lambda 值时，目标是在简单化和训练数据拟合之间达到适当的平衡：
如果您的 lambda 值过高，则模型会非常简单，但是您将面临数据欠拟合的风险。您的模型将无法从训练数据中获得足够的信息来做出有用的预测。
如果您的 lambda 值过低，则模型会比较复杂，并且您将面临数据过拟合的风险。您的模型将因获得过多训练数据特点方面的信息而无法泛化到新数据。
理想的 lambda 值生成的模型可以很好地泛化到以前未见过的新数据。遗憾的是，理想的 lambda 值取决于数据，因此您需要手动或自动进行一些调整。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

【机器学习】正则化项L1和L2的直观理解
http://blog.csdn.net/jinping_shi/article/details/52433975...
求求你不要再说了阅读 1,100评论 0赞 1
【机器学习】正则化
http://www.cnblogs.com/jianxinzhou/p/4083921.html 1. The ...
求求你不要再说了阅读 628评论 0赞 1
谷歌开发者机器学习词汇表：纵览机器学习基本词汇与概念
谷歌开发者机器学习词汇表：纵览机器学习基本词汇与概念姓名：钟航转载自：http://mp.weixin.qq....
XavierZHH阅读 1,982评论 0赞 7
本周工作总结
本周在做裤兜语文教师端，之前教师端的开发进行到一半左右，只有基本的ui页面，并未对接接口数据。把学生端与教师端公用...
赵坪生阅读 231评论 0赞 0
20170718 晨读感悟把事情做好
相信大家在开始完成一件事情之初，都是想把事情做好的。但在实际生活中，或是因为遇到挫折，或者因为长久没看到成...
梅桂_b4d9阅读 187评论 0赞 0

赞1赞

赞赏

手机看全文