关于幸存者偏差
有人问,在纽约地铁里读书的人,是有学问的概率大还是没学问的概率大。
我们先看两个奇怪的现象,有人辛辛苦苦开了个饭店,把消费者当上帝,上帝说口味怎么调整,我就怎么调整,结果生意反而越来越差了;有人没日没夜搞了一款软件,拼命收集用户建议,用户想要什么功能我就改进什么功能,结果流失的反而越来越多了。为什么你明明按照他们的做了,结果却越来越差了。
他们再骗你吗,没有,他们说的都是实话,那为什么会这样呢,是因为基础概率出问题了。凡事是要考虑基础概率的,就是要放到一个更大的场景中去考量,否则你拿到的是一个严重偏差的数据。用他来做决策毫无意义。
你开一个饭店,是有人给你提建议,可是你别忘了,那些觉得你的菜不好吃可能就直接不来了,你做个软件,是有人给你填问卷,可是你别忘了,那些觉得你软件难用的人可能就直接卸载了。能给你提意见的人,永远是一小部分人,你真正要问的人恰恰是那些没提意见的人,拿偏差的样本来做决策,是要吃大亏的。
比如前一阵流行的民国小学生作文,惊艳了很多人,以至于大家说现在的小学生退步太多了,不对的,能保留下来的,一定是顶尖的作文,那些普通的作文,根本没人收集啊。再比如1936年美国大选,当事电话调研了140万人,数据明明显示的是兰登会赢得大选,结果呢,罗斯福赢了,为什么呢?因为1936年电话还是富人的专利,你听不到那些穷人的声音,在比如我们总说孩子挑食,不吃这个不吃那个的,为什么从来不说大人挑食,因为大人只点他们喜欢吃的交个外卖还要备注一下不要加香菜,拿到手里怎么会挑食呢,关于基础概率,当年有一个 最经典的例子
“幸存者偏差”来源于二战中一个著名的故事:1941年,第二次世界大战中,空军是上市最重要的兵种之一,盟军的战机在多次空战中损失严重,无数次被纳粹炮火击落,军方高层自己统计了所有返回飞机的中单情况,发现飞机的机翼部分中弹较为密集,而机身和机尾部分则中弹较为稀疏,于是当时的盟军高层的建议是:加强机翼部分的防护。同时盟军总部秘密邀请了一些物理学家、数学家以及统计学家组成了一个小组,专门研究“如何减少空军被击落概率”的问题。
军方高层的建议被小组中的一位来自哥伦比亚大学的统计学教授——沃德驳回了,沃德教授提出了完全相反的观点——加强机身和机尾部分的防护。他说你们统计样本只是平安返回的战机;弹孔少并不意味着不会中弹,而是一旦中弹就回不来了,机翼弹孔多还能飞回来,恰恰说明不致命。
结果很多飞行员不干了,我开了那么多年飞机,没有人比我更清楚,机翼中弹开回来有多难,你连飞机都没有开过,我凭什么相信你。
沃德教授说,飞机各部位受到攻击的概率,理论上是均等的,但是引擎罩上的弹孔却比其他部位少,那失踪的弹孔到底在哪里呢,一定是在那些飞不回来的飞机上。为了确定方案,军方派情报人员区调查,果然。
军方采用了教授的建议,加强了机尾和机身的防护,并且后来证实该决策是无比正确的,盟军战机的击落率大大降低,这就是“幸存者偏差”故事的来源。
明白了这个道理,为什么在战地医院里,腿部中弹的士兵更多,因为那些胸部中弹的根本来不及送到医院啊,问什么袜子总是丢一只呢,因为丢两只的时候,你不知道她丢了。为什么老板都那么挣钱呢,因为那些亏钱的都打工去了,请问纽约地铁里面看书的人,大概率是有学问呢还是没学问呢,重点是什么,纽约地铁。