正则化

L0范数:很难优化求解(NP难问题)

L1范数:是L0的最优凸近似,且具有特征自动选择和使得模型更具解释性的优点

L2范数:使得权重接近于0但是不等于0,且较均匀。一般认为参数值较小的模型较简单,能适应不同的数据集,一定程度上避免了过拟合。有利于处理条件数不好情况下矩阵求逆问题。不但可以防止过拟合,还可以让我们的优化求解变得稳定和快速。

正则化的本质
正则化的目的是限制参数过多或者过大,避免模型更加复杂。为了达到这一目的,最直观的方法就是限制w的个数,但这类问题属于NP-hard问题,求解非常困难。所以一般的做法是寻找更宽松的限定条件。如L2正则化就是对w的平方和做数值上界限定,即所有w的平方和不超过参数C。这时候我们的目标就转换为:最小化训练样本误差,但是要满足w平方和小于C的条件。

L2的限定区域是平滑的,与中心点等距,而L1的限定区域是包含凸点的,尖锐的,这些凸点更接近最优解位置,或者说和目标函数的接触机会远大于其他部分,就会造成最优值出现在坐标轴上,很多w为0

L2不带绝对值,求导计算方便

  • L1、L2范数的适用场景

L1范数是各参数的绝对值之和(稀疏规则算子),L2范数是各参数平方和的开方(权重衰减)。L1范数会去除掉一些没有信息的特征,把这些特征对应的权重变为0。但 L2范数会使的w 的每个元素都接近于0,但不会等于0。L2精度更好,L1的效果在处理稀疏矩阵数据的时候比较棒

  • L1正则化使得模型参数更具有稀疏性的原理是什么

解空间的不同造成的 ,如上图所示,L2正则项约束后的解空间是圆形,L1正则项约束后的解空间是多边形。多边形的解空间更容易在尖角处与等高线碰撞出稀疏解

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,793评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,567评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,342评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,825评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,814评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,680评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,033评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,687评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,175评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,668评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,775评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,419评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,020评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,206评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,092评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,510评论 2 343

推荐阅读更多精彩内容

  • 一、正则化基础 正则化等价于结构风险最小化,就是在经验风险后面加上了表示模型复杂度的正则化项或惩罚项。 正则化的作...
    arrnos阅读 1,565评论 0 4
  • 为了解决过拟合问题,通常有两种办法,第一是减少样本的特征(即维度),第二就是我们这里要说的"正则化". 下面是一些...
    ZeroZone零域阅读 438评论 0 0
  • 正则化(Regularization) 机器学习中几乎都可以看到损失函数后面会添加一个额外项,常用的额外项一般有两...
    MiracleJQ阅读 6,824评论 0 8
  • 概念 L0 范数:指向量中非0的元素的个数。如果我们用L0范数来规则化一个参数矩阵W的话,就是希望W的大部分元素都...
    NoahU阅读 1,230评论 0 0
  • 本文翻译自文章:Differences between L1 and L2 as Loss Function an...
    山阴少年阅读 6,554评论 0 11