贝叶斯概率的十层理解(1)

世界是我们的,也是你们的,但归根结底,世界是贝叶斯的。
—— 胡所巴道·丹史乎由谢道里斯基

希望这篇文章能够带大家一起了解神奇的贝叶斯概念,启发更多神奇的思考。

第一层 、基本知识:贝叶斯是谁?贝叶斯公式是什么?

托马斯·贝叶斯(Thomas Bayes,1702~1761)是 18 世纪英国的一位数学家、神学家和哲学家。他在概率论领域做出了重要贡献,被认为是概率论理论的创始人之一。
贝叶斯大概生活在咱们的康乾盛世的雍正乾隆帝在位时期,他比牛顿小40多岁,和欧拉差不多大,贝叶斯死后几年,数学王子高斯就出生了。所以,贝叶斯可能见过老年的牛顿,但肯定没遇到过高斯。

贝叶斯的时代

贝叶斯最大的贡献就是总结出了贝叶斯定理,这个牛到可以统治宇宙的公式就是:

P(B|A)=\frac{P(B)*P(A|B)}{P(A)}=P(B)*\frac{P(A|B)}{P(A)}

这个公式里面P(A|B)表示B事件发生的条件下A事件发生的概率,同样,P(B|A)就是A事件发生的条件下B事件发生的概率。

第二层、套用公式:怎么用贝叶斯公式解决问题?

我们两个例子。

第一个例子

二姨给你介绍了个男朋友,只说是上班族,其他什么信息也没给就安排你们见面,一见面,你发现他是个秃头,现在就问,你认为这人是程序员还是其他普通上班族?有多大概率是程序员?

30%程序员秃头

已知40%的程序员都秃头,而其他普通上班族只有10%会秃头。那么你是否就认为他很可能是个程序员呢?

错!你不懂贝叶斯,我们看看贝神父怎么叫我们做人,科学计算已知秃顶的程序员概率有多大。

直接套用公式:

P(程|秃)=\frac{P(程)*P(秃|程)}{P(秃)}

分析一下。

  • 我们需要知道所有人里面程序员的概率P(程),估算一下,所有上班族里面大概10%是程序员,就是P(程)=0.1

  • P(秃|程)我们已知等于30%。

  • P(秃)是多少呢?就是所有人里面有多大概率是秃头,100人为例,10个程序员40%就是4个秃头,另外90人里面10%就是9个秃头,加一起得到P(秃|所有)=P(秃且程|所有)+P(秃且非程|所有)=4\%+9\%=13\%

带入公式:

P(程|秃)=\frac{P(程)*P(秃|程)}{P(秃)}=\frac{10\%*40\%}{13\%}=\frac{0.1*0.4}{0.13}=4/13\approx0.3

得到最终结论:此人仅有不足三分之一的可能是程序员

第二个例子

这个有点难,咱们慢慢来。

你去医院检查是否得了某种癌症,检查结果是:你阳了...医院检查结果的正确性是80%,那么就问,你现在应该慌不慌?应该有多慌?

估计你要吓死了。但作为一个学过贝叶斯公式并且掌握小学数学的人,我们来算算看,你现在有多大概率真的得了这种癌症,就是P(病|阳)的值,即拿到阳性报告的时候,你的患病可能是多大。

先套公式:

P(病|阳)=\frac{P(病)*P(阳|病)}{P(阳)}

分析一下。

  • 首先我们必须知道所有人里面患这个病的概率P(病),假设在所有人里面这个癌症的患病率是5%,即P(病)=5\%

  • 难点在这个90%正确率怎么理解。100个报告里面,有80个是正确的(阳了就真有病,阴了就真没病),还有20个是错误的(没病但阳了,有病却阴了)。那么,有病的里面阴了几个,没病的里面又阳了几个呢?我们假设认为对于有病和没病的人,报告错误率都是20%,即5个有病的人来了会错报1个阴性,95个没病的人来了也会错报19个阳性。所以P(病且阳|所有)=5\%*80\%=4\%P(无病且阳|所有)=95\%*20\%=19\%

  • P(阳|所有)=P(病且阳|所有)+P(无病且阳|所有)=4\%+19\%=23\%

  • P(阳|病)=80\%

带入公式:

P(病|阳)=\frac{P(病)*P(阳|病)}{P(阳)}=\frac{5\%*80\%}{23\%}=4/23=17%

得出结论:你真正患病的可能性是17%,大概是六分之一

第三层、推理证明:颠覆认知的贝叶斯公式怎么来的?

开始之前我们做个小学三年级应用题:所有人里面有50%是男人,男人里面有10%是渣滓,请问,渣男占所有人的比例是多少?

答案是50\%*10\%=5\%,即

P(渣且男|所有人)=P(男)*P(渣|男)=50\%*10\%=5\%

忽略所有,可以直接简写为

P(渣男)=P(男)*P(渣|男)=5\%

现在我们可以开始了。

首先,我们知道下面这句是废话也是公理:

A事件发生且B事件也发生的可能性 = B事件发生且A事件也发生的可能性

就是:

P(A且B|所有)=P(B且A|所有)

例如:

P(男且渣|所有)=P(渣且男|所有)
P(秃且程|所有)=P(程且秃|所有)

好吧,你认为我在说废话,那就OK了,咱们继续。P(秃且程|所有)怎么计算呢?和算渣男概率差不多,就是100人里有多少是程序员,再乘以程序员里面有多少比例是秃子。

P(秃且程|所有)=P(程|所有)*P(秃|程)

同理,P(程且秃|所有)怎么计算呢?就是100人里有多少是秃子,再乘以秃子里有多少比例是程序员。

P(程且秃|所有)=P(秃|所有)*P(程|秃)

合在一起就是:

P(程|所有)*P(秃|程)=P(秃|所有)*P(程|秃)

简化去掉所有:

P(程)*P(秃|程)=P(秃)*P(程|秃)

移项除到右边:

P(秃|程)=\frac{P(秃)*P(程|秃)}{P(程)}

换成AB就是贝叶斯公式:

P(B|A)=\frac{P(B)*P(A|B)}{P(A)}

其实贝叶斯只是使用了小学三年级学会的乘法移项!


<未完待续>
下篇我们将关注贝叶斯因子以及更多有趣的相关算法和知识,敬请关注。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容