机器学习算法参数指标体系

如何在自然中衡量事物的好坏?
人类从一无所有到如今主宰地球依靠的正是不断的寻求最优解,更是在极少数洞察宇宙规律的天才带领下总结出了客观规律并加以运用。
人类有了尺规才能衡量事物的长短,所以尺是一项天才的发明,它解决了按照一个纬度去衡量比较其他物体的问题。有了量化的标尺所以人才能批量制造工具,才不会担心与其他人的协作是否会功亏一篑,才使得更大范围的人类合作成为可能。举一反三,从一个纬度扩展到其他纬度便是扩展了知识版图,重构了人类社会的基础。


机器学习的整个体系应该如何评价呢?
怎么样的标准能够客观比较算法呢?
可以通过统计学检验来对比比较机器学习算法性能。


算法评估标准

回归问题

  • mae
  • mse
  • amse

分类问题

  • 准确度score
  • 混淆矩阵
  • 精准率
  • 召回率
  • roc曲线
  • pr曲线

混淆矩阵

1499410-20190816101253312-770308361.png

混淆矩阵的行数和列数一般是由分类算法的分类结果数目决定的,对于n各分类结果,混淆矩阵是nxn的矩阵,行和列的索引就是n个分类结果,其中行代表真实值,而列代表的是预测值。矩阵Axy每个网格里的值代表了真实值在x的情况下预测为y的数据样本个数。根据混淆矩阵得到的矩阵结果,我们可以再次定义两个评价指标,称为精准率precision和召回率recall,其中精准率precision=预测正确个数/预测总数,召回率recall=预测正确个数/真实所有个数。


1499410-20190816101213743-894383142.png

精准率和召回率的算法评判指标的解读应该结合具体分析问题的方向和实际场景,不同的场景对于不同指标的侧重点是不一样的。比如在股票预测里面我们更加注重精准率,我们更加注重预测结果的准确度,而召回率低一点意味着我们漏掉了一些希望的结果,而这个影响不大;而在疾病预测里面召回率则更加重要,因为我们更加希望把确实患有疾病的人群检查出来,不想漏掉实际患病的人群,而此时预测的准确率低一点也没有关系。


1499410-20190816101103456-1810866442.png

也有一些情况并不是只关注精准率和召回率中的一个,而是需要同时兼顾精准率和召回率,这个指标有一个叫做F1score,它的指两者的调和平均值,而非简单的求取平均。它的特点是如果精准率和召回率一个特别大,一个特别小,则输出的F1 score则比较小,它可以防止正常平均时的一些判断偏差的情况,比较好的兼顾两者的共同大小。
1499410-20190816102313048-890517947.jpg

精准率和召回率在机器学习算法的分类算法中是存在矛盾的,随着判断score判断阈值的提高,精准率会不断地增大,而召回率是不断减小的。

PR曲线,即precision-recall curve,它可以表示出机器学习分类算法的召回率随着精准率变化的曲线,通过对比可以看出不同算法的好坏,一般与x/y轴所围成的面积越大,其综合性能也就越好。


1499410-20190816102330275-749517501.jpg

ROC曲线,描述TPR和FPR之间的关系,是统计学上经常用到的曲线和指标曲线,其主要的指标是ROC曲线与x轴所围成的面积roc-au_score,面积越大,则模型越好。另外,ROC曲线对于具有极偏数据是不敏感的。


1499410-20190816102433679-182440983.jpg
1499410-20190816102504444-1472029189.jpg

额外参考资料 https://www.jianshu.com/p/715a1a5a4dbdhttps://www.cnblogs.com/asialee/p/9800039.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,590评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,808评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,151评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,779评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,773评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,656评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,022评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,678评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,038评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,756评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,411评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,005评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,973评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,053评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,495评论 2 343