机器学习系统设计的算法评估与误差分析

        本文是coursera上吴恩达老师的machinelearning课程第六周的个人笔记,如果有幸被同好看到,可以在留言中指出我的问题或者一起讨论!

一、算法评估

1、数据集的划分

        评估算法过程中,我们要将数据集分成训练集、交叉验证集、测试集,习惯上应该先将数据集随机无规律排序后按照6:2:2的比例进行划分。三个集合分别计算的代价函数J记为Jtrain,Jcv,Jtest。

2、模型(多项式)选择

        即假设函数h的次数,对于待测试的的不同次数的假设函数分别利用训练集训练,将得到的模型再利用交叉验证集(简称验证集)计算代价函数即验证误差。验证误差最小的模型即位采用的模型,再利用测试集得到推广误差。

3、欠拟合与过拟合的诊断

        此时需要绘制Jtrain和Jcv的曲线来分析拟合好坏情况。如图所示,当次数很小的时候,对训练集和验证集拟合效果都不好(误差高),此时为欠拟合;当次数过大的时候,对测试集拟合情况会非常的好,但是对未知情况(验证集)的预测能力会下降(误差升高),即训练集误差很小,验证集误差过大,两者相差很大,此时为过拟合。得出结论:增大多项式次数能改善欠拟合情况。反之则相反。

误差与多项式次数的曲线

4、正则化与拟合情况的关系

        此时依旧需要绘制Jtrain和Jcv的曲线,但是横坐标为正则化参数\lambda 。如图所示,正则化参数越大,对拟合的“惩罚”就越大,所以会减少过拟合情况,\lambda 过大的极端条件下,即位欠拟合,过小即不做正则化处理,即为过拟合。得出结论:减小正则化参数能改善欠拟合情况。反之则相反。


误差与正则化参数的曲线

5、学习曲线

        一味的增大训练实例不一定能显著提升算法的能力,这个结论从学习曲线中得到。当Jtrain从很小增加到很大,Jcv从很大没有显著下降时,即位欠拟合,如图所示,即使增加m的数量,也无法改善此算法的能力。


欠拟合情况学习曲线

        当Jtrain从很小缓慢增加,Jcv从很大缓慢下降,此时在较少训练集下表现出很大的差距(large gap)时,即为过拟合,如图所示,随着m的增大,二者距离会越来越接近,进而达到改善算法能力的效果。


 过拟合情况学习曲线

        综合这两种情况得出结论:增加训练实例的数量可以改善过拟合情况,没有反之。

6、特征与神经网络

        对于特征,我们可以去掉一些无关特征来改善过拟合情况;或者增加更能预测结果的一些特征来改善欠拟合。

        对与网络较小的神经网络,参数少,容易导致欠拟合,但是计算量小;对于较大的神经网络,参数多,容易导致过拟合,可加入正则化参数来改善,计算量大。较大的神经网络加正则化的效果更好。

二、误差分析

1、Skewed Classes(分类偏移)

        分类偏移是指两个类别中其中一个类别出现的概率非常小,比如肿瘤预测,肿瘤患者在整个数据集中往往只占0.5%,剩余的99.5%都是健康的,在这样的情况下正常的考虑误差的方式将不适用,因为即使算法永远预测一个人是健康的,误差也只有0.5%。为了评估skewed classes情况的数据集,我们要引入查准率(precision)和查全率(recall)。

        查准率:预测为1的里面,确实是1的概率。

        查全率:实际是1的里面,被预测出来的概率。

        查准率和查全率都应该尽可能的大。这里面的1,选取概率小的那一个类别。所以按照肿瘤的例子,如果永远预测一个人是健康的(0),那么他的查准率为无穷大,但是查全率为0。

2、阈值与权衡查准率和查全率

        绘制下图,查准率查全率与阈值的关系。


查准率查全率与阈值的关系

        阈值是指假设函数h不一定只有在大于0.5的适合预测为1,也可以设置新的阈值,比如为了让病人警惕性更强一些,可以将阈值设置为0.3,这样可以查得更全(查全率高),也可以把阈值设置的更高比如0.9,这样只有当可能性非常大时才会被判断为肿瘤,也就是查得更准(查准率高)。

        为了权衡两个指标的关系,对于既定的几个阈值,计算他们的查准率P和查全率R,然后计算F1值:F1score  = 2\frac{PR}{P+R} 。选取F1最高的阈值,即可权衡查准率和查全率。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,236评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,867评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,715评论 0 340
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,899评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,895评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,733评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,085评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,722评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,025评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,696评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,816评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,447评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,057评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,254评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,204评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,561评论 2 343

推荐阅读更多精彩内容

  • 体验入 前几天和业务联系说感觉机子作出的值不准,业务了好多说机子出问题的可能性很小,今天业务让技术过来看一检测真的...
    93650345d0d1阅读 125评论 0 4
  • 今天三个图样,没想太多就开始,不想构图,不想搭配,就先把新学的春天变化版画上…… 然后把今天的图样填上,想到什么画...
    芯之禅绕阅读 149评论 0 0
  • 在《西方哲学史》里面,罗素有这样一个定义:一切可以解释的事情是科学,一切不可以解释的事情是神学,介于两者之间的是哲...
    喵星君大大阅读 452评论 0 0
  • 高效能人士的七个习惯是史蒂芬.柯维创造的一套标准操作系统,根据普遍原则和自然规律进行整合。 体系的中心原则:首先塑...
    啃书仔仔阅读 315评论 0 0
  • 武昌府街边的狗肉食肆是出了名的色香味俱全,厨子赵大全有一副去腥的好手艺,且菜量特别的实诚,每日食客都络绎不绝。...
    猪与地下城阅读 224评论 0 0