小数法则是一种认知偏差,人们习惯于将小样本中某事件的概率分布当成了总体分布。
有一项研究对美国3141个县的肾癌发病率进行调查,调查结果显示发病率最低的县都位于人口稀少的乡村。通过这一调查结果,人们很容易得到结论,认为肾癌发病率低主要是因为乡村的生活方式更健康,拥有纯净的空气和饮用水,蔬菜没有打农药和添加剂,人的压力也更小。
现在,想一下肾癌发病率最高的县的情况吧。假如这些易发病的地方差不多同样位于人烟稀少的乡村。这时,人们又会作出推断,导致肾癌高发的原因是乡村的贫困——医疗条件差,不讲究卫生,高盐高脂肪饮食,酗酒,性格暴躁。这样,问题就来了,乡村方式不可能既是发病率高又是发病率低的原因。
问题的关键不是这些县位于农村,而是乡村的人口稀少。相对于大样本,极端的结果(高发病率和低发病率)更容易出现在小样本中。人口的稀少既不能引发癌症,也不能躲避癌症,只会使癌症的发病率比人口聚集的地区更高或更低。在某个人口稀少的县,癌症发病率并非比人多的地方更高或更低,只是这个县正巧赶上了一个特殊的年份调查而已。
对小数法则的盲信在我们的生活中随处可见,大部分人相信小样本能反映调查对象的整体情况,这也就是我们通常所讲的“以偏概全”吧。
比如说:现在如日中天的知识付费,大家看到李笑来、薛兆丰、万维刚、武志红等大神在得到的专栏订阅量动辄几万甚至十几万。于是,很多人认为中国成年人为了知识付费的浪潮已经滚滚而来,但事实却是:相对于中国十几亿的人口来说,万的数量级根本不能说明什么,相反,我们看到的更多的是,没几个人会想到为一本电子书付出哪怕10块钱的价格,他们想的是免费……
很多人看到有些人做生意、开店赚了不少钱,发达了,实现财富自由了,可以用金钱买别人的时间了。于是,不管自己懂不懂做生意,不管自己有没有经济实力,不管自己有没有经营头脑,也跑去开店、做生意,以为自己比别人厉害,只要做生意就一定会赚钱、会发财,到最后,不但钱没赚到,还搭进了自己的老本。这也是因为他们只看到了那些少数做生意成功的人的辉煌,而没有考虑到大部分做生意的人的经营惨淡。
夸大对小样本的信任只是众多认知偏差中的一种,为了更好的消除小数定律的不良影响,我们应该知道:大样本比小样本更精确,小样本比大样本产生极端结果的概率大。