大学里面课程学过贝叶斯,也翻了统计教材,背下了公式长什么样子.
我猜许多人都是知道了公式(A|B)换来换去,但其实不太清楚公式表达的业务意思.
看了<白话统计>,有所领悟,用自己的话翻译下贝叶斯公式.
1
教材里面的公式是这样的
用自己的话改写一下
什么意思呢,先看一个案例.
2
某市的男性,女性司机的比例为60% 和40%,现在发生了一起车祸,司机把墙壁撞翻了. 男性司机撞墙可能性1%,女性司机撞墙可能性5%,我们想了解一下,这位撞墙的司机是男性的概率如何.
来,请辨析一下两个概念,案例中
"男性,女性司机的比例为60% 和40%"是"规律"
我自己理解,"规律":已经存在的前提条件."撞墙"是一个"现象".
我自己理解,"现象":发生的某种情况.
3
首先看等式左边 P(规律|现象)
意思是 在现象发生的前提下,某种规律也发生的概率.
用案例来说,是"车撞墙的前提下,司机是男性的概率".
这里有个有意思的点,为什么等式左边是" P(规律|现象)",而不是" P(现象|规律)"?
因为我们在使用贝叶斯,往往是想知道"事情发生的前提下,属于某种情况"的概率.
重点在于"事情已经发生的前提"
而不是"某种情况的前提下,事情发不发生"的概率.
4
再看等式右边
P(现象|规律) 是"某种情况的前提下,事情发生了"的概率
用案例说,就是"男性司机的前提下,发生了撞墙"的概率,也就是1%
P(规律)是"某种情况"发生的概率
用案例说,就是"男性司机"的概率,也即是60%
P(现象)是"事情发生了"的概率
用案例说,是"发生撞墙"的概率
这里拆分下,发生撞墙可能是
- 男性司机,发生了撞墙 60% * 1%
- 女性司机,发生了撞墙 40% * 5%
所以总共 60% * 1% + 40% * 5%
5
用案例,综合数据
P(男性司机|发生撞墙) =( 0.01 * 0.6) / ( 0.01 * 0.6 + 0.05 * 0.4) = 23%