最近看曹政推荐的《这才是心理学》,英文名 《How to Think Straight About Psychology》(号称贴吧之父俞军也推荐),这本书确实是好书。中间提到很多人都没有概率推理的概念,人的直觉在涉及概率时很容易犯错,因为人类真正搞清楚概率也就最近几百年的事情,而且仅限于小部分数学家,概率观还没有进入人们的常识性观念。
《这才是心理学》书中里面有一个在一定情况下预估某人发病的概率,据说很多医生都会搞错(欧美国家的医生基本都是最顶尖的理科生,和中国不太一样)。条件是这样:
- 假设一个地区的艾滋病发病率是千分之一。
- 某种测试手段对真有艾滋病的人测试结果是 100% 阳性,就是没有失误;但是对没有艾滋病的人测试的结果可能有 5% 的可能性误诊为阳性。
就是下图的左上角数据(下图是我在公司里分享时的简单板书)。
问题是如果目前有一个未知病史的人被测出 HIV 阳性,那么这个人真携带 HIV 的可能性是多少?就是上图的左下角问题,真阳性 (Positive) 的几率是多少?
我问了好几个人,包括我自己的第一直觉都是这个人真携带 HIV 的可能性应该挺高的。但是实际上不是。
Bayes
我们可以用贝叶斯公式来解决这个问题(上图右上角的公式)。使用这个公式最重要的是确定如何界定 A、B 事件分别是什么,以及他们的条件概率。(关于贝叶斯原理有很多很好的文章介绍,比如这篇。这里我就不再弄斧了。
在上图中,我界定
A 事件:在这个地区随意一个人得 HIV;它的概率
P(A) = 0.1%
B 事件:在这个地区随意一个人被测试为 HIV 阳性; 它的的几率
P(B) = 0.1% + 99.9%*5% ≈ 5%
B|A 事件: A 发生时 B 也发生,它的概率, 就是一个人携带 HIV,那么被测试出来的几率;
P(B|A) = 100%
A|B 事件: 这个就是我们要计算的事件,B 发生下,A也发生,它的概率,就是一个人被测试出 HIV 阳性,那么这个人真实携带 HIV 病毒的几率
P(A|B)
?
所以根据贝叶斯公式,就可以算出约为 2%(如上图中的右下角),其实概率挺低的。所以我们的直觉往往对于概率推理往往是有误导性。
个人觉得直觉应用在对人的判断上很合适,比如判断一个人值不值信任,可以做长期朋友吗?往往见面的第一印象挺准的。但是对于一些涉及到计算、概率推理之类的,坚决不能依靠直觉,得好好算算。