不要被它的名字骗了,这不是关于品茶的书籍,而是一本正宗的统计学发展史。
20世纪20年代末一个夏日的午后,在英国剑桥,一群大学教员、他们的妻子以及一些客人围坐在室外的一张桌子上喝下午茶。一位女士坚持认为,将茶倒进牛奶里和将牛奶倒进茶里的味道是不同的。在座的科学家都觉得这种观点很可笑,没有任何意义。这能有什么区别呢?他们觉得两种液体的混合物在化学成分上不可能有任何区别。此时,一个留有尖髯的男子激动了起来:“让我们检验这个命题吧。”他开始规划一个实验,让这位女士按顺序品尝若干杯
饮品,其中有些是加了茶的牛奶,有些是加了牛奶的茶。
有些读者会说:这绝对是吃饱了撑的!不管这位女士能否分辨这两种饮品,这件事有什么意义呢?这个问题一点也不重要,对科学也没有益处。他们嘲笑道:“这些聪明人应该把头脑用在能够造福人类的事情上。”
好了,这是全书的开头,也是唯一一个看起来不费力气的地方。毕竟,统计学(statistics)属于应用数学的分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化分析与推断预测,从而为相关决策提供依据和参考。而作为一个读书时候数学成绩就一团糟的人来说,这本书看的我是如坐针毡。并且,我相信,对于绝大多数普通民众而言,艰深的数学算法和陌生的大师理论也绝不会成为大家关注的焦点。
那么,每一个我们,每天都会关注些什么呢?
当电视里的新闻主播宣布一项医学研究证明被动吸烟会让非吸烟者的死亡风险翻番时,几乎所有的观众都认为自己知道这是什么意思。当一项民意调查的结果显示认为总统工作表现不错的公众比率65%上下浮动3个百分点时,大多数人都觉得自己知道这里的65%和3%代表什么含义。当气象员预测明天下雨的可能性是95%时,计划出行的人们基本都会带上一把雨伞。
还有那一连串的十万个为什么。赌博、炒股、买彩票,哪种方式更能让你一夜暴富?科学定律是真理吗?丈母娘究竟与房价涨落是否存在因果关系?为什么越来越多的考试采取偏差值而不是分数排名的方式来判断学生成绩的好坏?……
看吧,日常生活中我们对于具体数字的依赖已经到了令人发指的地步了,那么你知道为了得出这样的结果需要做哪些事情,又会发生怎样的争议呢?来,让我们一起走进背后的故事。
没有没有,开玩笑的啦!不过,事先说一句,如果你抱着解决问题或者是娱乐消遣的心态的话,那么这本书我严重不推荐。就像作者戴维·萨尔斯伯格在自序中写的那样那样:“本书无法让读者学到足够多、可用于科学数据分析的统计方法,因为这需要数年研究生课程的学习。”
所以这本书到底在讲些什么?有没有必要看?看完这本书究竟有没有用?
放轻松,让我们回到开头,回到剑桥那个阳光明媚的夏日午后吧。女士有可能猜中饮品的混合方式,也有可能猜错。在尖髯男子的指导下,他们开始讨论如何验证这种判断,这件事的乐趣在于找出一种方法,判断她的说法是否正确。不管普通大众如何看待科学及其影响,不幸并且不争的事实是,大多数科学家之所以投入到研究当中,只是因为他们的对结果感兴趣,并且乐在其中。优秀的科学家很少会考虑他们的工作是否具有什么重要意义。
只是单纯的喜欢,单纯的想知道答案,于是便埋头沉醉。你说我是浪费生命也好,小题大做也罢,我统统都听不见。只想专注于正在做的实验和手边需要采集的一个个详实的数据,至于有没有用?谁管它呢。但是没有开始,便一定不会有结果。这才是千千万万只小白鼠和成片累牍的日日夜夜想要告诉我们的,关于数据的品格。
哦,对了,至于那位品茶的女士,她后来怎样了呢?那位尖髯男子,也就是后来的费希尔爵士没有描述那场实验的最终结果如何。不过在场的统计学教授史密斯先生告诉我们,那位女士正确的判断出了每一杯茶的制作方式。