最近开始读Computer Age Statistical Inference: Algorithms, Evidence and Data Science,前言简单介绍了统计推断的历史,在此简要翻译。
统计推断是一门应用广泛的学科(an unusually wide-ranging displine),处于数学、经验科学(empirical science)和哲学的三相点(triple point,原意是化学中某种物质固、液和气三相平衡共存时的温度和气压)。该学科始于1763年,彼时贝叶斯法则发表(象征着该学科哲学的一面;贝叶斯法则早期的拥护者把它当作上帝存在的论据)。本书标题中的“计算时代”指的是长达250年的历史中,离我们最近的四分之一——从1950年至今。在这段时期,计算(过去统计学应用的瓶颈)速度和易得性较以往提升百万倍。
本书旨在以从小型飞机(而非喷气式飞机和卫星)的高度鸟瞰庞然大物的视角,考察过去60年统计学演化的历程。各章依次讨论一系列影响深远的话题——广义线性模型(generalized linear models)、生存分析、刀切法和自助法(jackknife and bootstrap)、错误检出率(false discovery rates)、经验贝叶斯、马尔科夫蒙特卡洛(MCMC)、神经网络等——简述其重要的方法学进展和推论证成(inferential justification,来源于知识论,指基于一定belief做出合理推断)。
不用说,电子计算是整个故事的核心。但这并不意味着每一次进步都和计算机有关。并非人人都渴望跨越这座通往新大陆的大桥。(A land bridge had opened to a new continent but not all were eager to cross)。即使受限于机械计算,诸如经验贝叶斯和James–Stein 估计(James–Stein estimation)的话题可能仍然会出现。而其它话题,如自助法和比例风险(模型)却纯粹是计算机时代的产物。几乎所有21世纪统计学的话题都依赖计算,但我们的小型飞机还需要一段时间才能到达新千禧。
字典上对统计推断的定义往往将它等同于整个学科。这在当今包含海量基于计算机的数据处理算法的大数据时代,显得不尽如人意。在此我们试图将“统计大业”的两部分分开,因为针对特定领域的算法开发,比如用于预测的随机森林,与它们支持的推断论据截然不同(algorithmic developments aimed at specific problem areas, for instance random forests for prediction, as distinct from the inferential arguments offered in their support)。
宽泛地说,算法是统计学家在做的事,而推断则是讲他们为什么研究。“统计大业”已经打响了一块金字招牌——数据科学,强调算法思维而不是推论证成(inferential justification)。本书后面的章节,从数据科学的视角,考察大规模预测算法如boosting和深度学习。
现实中并不存在所谓“生物学推断”或“天文推断”或“地理推断”的学科。那为什么需要“统计推断”呢?答案很简单:自然科学能够自行判断某个设想或概念的准确性。统计学距离自然一步之遥,通常用于解释自然科学家们的观察。没有自然作为一名公正的裁判,我们需要一套指导和改正的数理逻辑系统。统计推断就是这样的系统,脱胎自这250年数据分析经验。
本书沿着历史的脉络向前推进,分为三部分。第一部分回顾四大主题——经典推断、贝叶斯推断、频率推断和费舍尔推断,均处于电子计算时代之前。现代实践在不改变其基本轮廓的情况下大大拓展了这四种推断的范围(类比古典文学和现代文学)。第二部分涉及早期计算机时代的发展,从1950年到1990年。在这段过渡时期,最容易同时在理论和实践上,见识到快速计算能否有效推进统计方法学进展。第三部分,“二十一世纪的话题”,将故事引向当下。当下是一个极富野心(算法)的时代(Ours is a time of enormously ambitious algorithms),以至“机器学习”成为谈虎色变的流行语。这些算法的证成(justification)是一直是现代统计推断的任务。
本书既不是目录也不是百科全书,话题的选择均是基于能否恰当展示计算方法学和推断理论的相互作用。某些未提及的话题,如时间序列、广义估计方程(general estimating equation)、因果推断(causal inference)、图论模型和实验设计,也十分有用。总之,这并不是说本书所论及的话题是唯一值得讨论的话题。
甚少着墨的还有渐近分析和决策论,即领域内较为“数理统计”的一面。本书原本打算保持近于硕士水平统计学家和博士一年级学生讨论的专业水平,但免不了某些介绍不经意间进入深水区,这种困难更多是来自统计思想的本质而非数学运算。读者若发现我们的“鸟瞰”围绕某些话题盘旋太久,应该毫不犹豫地往后翻。大部分情况下,各章节可以独立阅读(虽然它们有一个相互联结的大主题)。尤其是非统计学背景、纯粹因为对某些话题(比如生存分析或boosting)感兴趣才找到本书的读者,此建议十分实用。
实用学科冒着失去自我的风险,服务于各式各样的苛刻任务。多数情况下,统计学能保持哲学的一致性,尽管外在的需求曲线一直上升。在过去60年,该领域实际上从发源于数理逻辑转向了以计算为重点。本书一个话题接一个逐步追溯其动向。关于“下一步会发生什么?”,本书不试图回答。如有兴趣,不妨读读后记,那里讨论了数据科学的兴起。
PS:最后一段看原文更好,在此贴出。
Useful disciplines that serve a wide variety of demanding clients run the risk of losing their center. Statistics has managed, for the most part, to maintain its philosophical cohesion despite a rising curve of outside demand. The center of the field has in fact moved in the past sixty years, from its traditional home in mathematics and logic toward a more computational focus. Our book traces that movement on a topic-by-topic basis. An answer to the intriguing question “What happens next?” won’t be attempted here, except for a few words in the epilogue, where the rise of data science is discussed.