「ML笔记」- 假阳性&假阴性

问题:机器学习里,什么是假阳性,什么是假阴性?

学习ing,在机器学习之旅,麻省博士小姐姐带我 ︿( ̄︶ ̄)︿

曾经,在 python 的机器学习开源库 sklearn 的混淆矩阵模块 scikit-learn-confusion_matrix 里,笔者常常看tn, fp, fn, tp等缩写变量,百思不得其解。

>>> tn, fp, fn, tp = confusion_matrix([0, 1, 0, 1], [1, 1, 1, 0]).ravel()
>>> (tn, fp, fn, tp)
(0, 2, 1, 1)

如下图,检索得到的网络资料,专业论述严谨准确,但解释起来冷冰冰,对我而言,仍然显得晦涩

混淆表格(有时候也称为混淆矩阵),是由false positives,falsenegatives,true positives和true negatives组成的两行两列的表格。




True positive (TP) :真实为P,预测为P
True negative (TN): 真实为N,预测为N
False positive (FP):真实为N,预测为P
False negative (FN):真实为P,预测为N

包括博客文章里解释的「猫狗识别分类」例子,听过之后,笔者依然「一头雾水」。

看过这个视频之后,豁然开朗。

ML Basics: False Positives, False Negatives

回答:假阳性False Positives&假阴性False Negatives

快乐学习,从形象的例子开始。

假设:给你一百张图片。让你来判断 -> 每张图片中是否有人类?

这个任务需要预测两种情况——有人&没人,叫做二元分类。

  • 图片里有人,你识别「有人」——叫做「真阳性(True positive)」
  • 图片里没人,你识别「没人」——叫做「真阴性(True negative)」


  • 图片里没人,你识别「有人」——叫做「假阳性(False postive)」


  • 图片里有人,你识别「没人」——叫做「假阴性(False negative)」

总结:

  • 预测正确,以「True」开头。
  • 预测错误,以「False」开头。
  • 预测结果是阳性(比如「有人」、「患病」),以「 postive」结尾。
  • 预测结果是阴性(比如「没人」、「无病」),以「 negative」结尾。

术语:准确率(Accuracy)

正确识别的图片的百分数——准确率(Accuracy)= TP+TN / TP+TN+FP+FN

误区:TP&TN 比 FP&FN 更重要

比如,在医学影像诊断疾病的应用中。

对于没有疾病的监测者,预测 TA 可能有病,需要进一步检查。这个无伤大雅。
但对于患病的监测者,预测 TA 没有疾病风险,那就是严重问题。

我们会更关注「假阴性率(False Negative Rate)」 = FN/FN+FP
换句话说,我们关注——对于多少包含患病风险的检测者,我们预测错误的比例是多少?

在安全防护领域,「假阳性率」需要关注:

对于,自己手机的指纹识别功能,识别错了自己的指纹,这是「假阴性」,几秒钟之内多按几次,也能解锁手机,那也还好。
但如果,用别人的指纹,也能解锁你的手机。那就问题严重了,这是「假阳性」。

这个例子里,我们会更关注「假阳性率(False Postive Rate)」 = FP/FP+TN。换句话说,我们关注——对于多少不是本机主人指纹的打开尝试,我们预测错误的比例是多少?

总结:

  • 在智能医疗领域,比如患病风险监测的应用,我们会更关注「假阴性率(False Postive Rate)」,对于多少包含患病风险的检测者,我们预测错误的比例是多少?备注:阴性定义是——检测者没有患病风险,无需进一步检查。
  • 在安全防护领域,比如指纹解锁功能,我们会更关注「假阳性率(False Postive Rate)」,对于多少不是本机主人指纹的打开尝试,我们预测错误的比例是多少?备注:阳性定义是——指纹是本机主人的。

changelog

19.06.07 init
19.07.11 publish

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,053评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,527评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,779评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,685评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,699评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,609评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,989评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,654评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,890评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,634评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,716评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,394评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,976评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,950评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,191评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,849评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,458评论 2 342

推荐阅读更多精彩内容