1、“小样本谬误”与“大数据时代”
很多时候,我们在通过某项测验来验证某个问题的时候,一个很容易犯的错误就是“选取了过少的样本”。这一方面是因为有时完备的样本很难得到,另一方面则是因为我们过于相信直觉,总觉得自己的判断是正确的,选取样本的行为不过是例行公事。但实际上,过小的样本会让假说不能被证实的概率上升至50%。
不过现在这一问题应该可以被解决了。美国国家标准与技术研究所(NIST)在2005展开了一项“机器翻译”的测评,之前从没做过机器翻译的 Google 以 5% 以上的优势毫无争议地领先了南加州大学、IBM沃森实验室等传统豪强,令所有人大吃一惊。刚开始都以为是技术的优势,后来才发现,相比于其他团队,Google 唯一的优势就是数据量够大。大即不同,也许大数据技术的持续进步,会进一步降低“小样本谬误”的发生概率。
2、信任多于质疑
对于每个人而言,对于某个信息,第一反应就是选择相信,尤其是在熟悉的场景下。
这也没有什么特殊的原因,相比于信任,我们的大脑并不擅长质疑。我们有一种不由自主将信息处理得尽可能连贯的天赋,以证实我们的猜想。而一旦有蛛丝马迹的证据能够证实我们的猜想,我们就会更加投入地信任,以证明自己的判断是对的。
这也是为什么朋友圈里经常会有一些漏洞百出、却刷屏的文章的原因了吧?
3、为随机事件找原因
我住的那个小镇有一个彩票店,每天晚上那里都会围着一群人在讨论什么。讨论什么呢?讨论彩票的走势图,这群彩友总是会费尽心机地研究前一段时间的中彩号码,然后得出一个新的号码下注,乐此不疲。
我当时上初中,虽然年纪小,但是似乎也觉得这种事没啥前途。后来学了概率,才知道买彩票这种事情属于“随机事件”,而任何两次“彩票中奖”都是相对独立的小概率事件,研究趋势图当然没什么卵用。
但是我还是理解他们想要去分析彩票规律的这个心理。毕竟,我们都非常愿意相信生活中大部分事情并不是随机的,其实真实情况往往相反——这是一个随机性遍布的世界。