概率论中的随机看似简单,其实暗藏玄机。
大数定律指在随机事件的大量重复出现中,往往呈现几乎必然的规律,也就是在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。
但大数定律并不说明在有限次的重复中,各种情况出现的概率是均匀的。比如有放回的抽取数字0-9,做十次,每个号码都出现一次的情形其实很少出现,很有可能出现了三次2,9一次都没出现。在以后的抽取中9出现的概率会更大吗?不会。大数定律并不会纠偏,让还没出现的尽快出现,而是指在以后很多次的抽取中,各个数字都会出现很多次,以至于此前的差别无关紧要。
在没有规律的地方硬找规律是个相当容易的事情,只要你愿意忽略所有不符合你这个规律的数据。记得大学宿舍一兄弟讲述他的老家人买六合彩的故事,举村疯狂。眼看着邻居发财了,人人收看天线宝宝,家家研读数字趋势,结果民生凋零。红学研究众说纷纭,成果汗牛充栋,从一部小说中解读出了种种阴谋玄幻,也许都是自己的心像吧。
另外,对于一些少量的随机数据,人们倒是很容易琢磨出所谓的规律。于是,有人总结出了地震年份定律,有人发现了“巴西队的礼物”定律。这个现象被诺贝尔经济学奖得主丹尼尔·卡尼曼戏称为“小数定律”。
问题的关键是随机分布不等于均匀分布。人们往往认为,如果是随机的,那就应该是均匀的,殊不知这一点仅在样本总数非常大的时候才有效。当初iPod最早推出“随机播放”功能的时候,用户发现有些歌曲会被重复播放,他们据此认为播放根本不随机。苹果公司只好放弃真正的随机算法,用乔布斯本人的话说,就是改进以后的算法使播放“更不随机以至于让人感觉更随机”。
想认清真相,不能只靠自己和周边人的有限经验,需要大规模的统计。
记住,随机不均匀,小数有“规律”。