科学探索有一个奇特的现象,就是不断将人类熟知的现象变得“不可理解”,表现出来的是:以陌生解释熟悉。重物往下落,轻物向上飘,如何解释此类现象?亚里士多德说每个元素都有属于自己的自然位置。重物由土构成,而土的自然位置是地面,所以重物自然向下落。牛顿给出的解释是重物和地球之间有相互吸引的作用力,爱因斯坦的解释更是反直觉,物体下落是因为空间在地球的作用下发生弯曲。对于大多数常人而言(当然也包括笔者),亚里士多德的理论是可理解的,而牛顿和爱因斯坦的理论是不可理解的,因为后者无法借由人类常识得到解释。但不得不说,科学探索的反直觉特征正是其理论深度的直接来源。可理解的亚里士多德学说无论无何无法解释水星近日点的摄动,更不可能预测光线在经过大质量球体时会发生弯曲,但是,“不可理解”的科学理论却可以。
然而,以不熟悉解释熟悉的科学探索模式,也再有意无意地将重要的“常识”概念剔除到科学研究之外,可能是因为这些常识概念无法用精确的数学语言加以刻画。科学的一个常规做法是将常识概念化约,或还原为(reduce)有精确定义,甚至可以用精确的数学方式表达的概念。例如,速度快和慢,用路程/时间,速度变化快与慢,用加速度,也就是速度的微分表示。这一方法论在人类获取知识的征程中屡试不爽,而且功勋卓著。可是,如何处理哪些非常重要,但无法以还原的方式处理的“常识概念”呢?一般的处理办法还是还原,或者束之高阁。珀尔在《The Book of Why》一书的第二章讲述了因果性如何被相关性取代的历史。
高尔顿最早研究发现生物性状的均值回归现象,然而,并没有进一步深入研究为什么生物性状能够维持在一个稳定水平,他认为这一现象不需要解释,只是一个现象而已。生物性状的稳定遗传和随机变异之间的冲突,让高尔顿思考成功能否遗传。于是,他收集了大量贵族的家族资料,发现贵族家族的成功并不能遗传,成功与是否是贵族没有相关性。高尔顿的学生——皮尔逊将相关性概念发展为相关性系数,认为相关性概念比因果性更为普遍。当伪相关性,如辛普森悖论、混杂因子,变得难以解释时,皮尔逊仅仅认为这是人为方式臆造的异质数据杂合现象,没必要研究。但是这个理由非常牵强,在没有真正揭示变量之间的因果关系之前,谁又能事先知道数据的伪相关性呢。二十世纪二十年代,赖特是第一个认为因果性不同于相关性的学者,并提出路径分析方法用于分析不同原因对结果的影响。他发明的将数据和图形语言结合的方法是珀尔的因果图分析的基础。从数据的相关性获得因果性的关键是先验地建立因果图,因此“没有因果假设,就没有因果结论(第五十七页)”。但是赖特的方法并没有引起足够重视,统计学还停留在寻找数据相关性的道路上。在六十年代,路径分析方法在不同学科被重新发现,比如,社会学家发明结构方程模型。但是,科学家仍然恪守统计学最初的禁令,要相关性,不要因果性。
为什么如此好的找寻因果关系的方法始终没有得到科学界的认可?科学对客观性的偏见和需要先验地画出 因果图是两个主要原因。经验主义始终是科学研究的最终依据,不增添任何研究者个人的观点,纯粹从中立的数据中获取知识,被科学家认为是保证知识客观性的唯一途径。因此,需要提前进行因果假设的因果推理就不合时宜地剔除在客观性研究之外。如何才能将主观和客观联系起来,这一难题需要靠贝叶斯概率推理完成。因为贝叶斯方法表明个人信念可以在出现新证据的情况下发生修正,进而不断趋向真实情况。这种方法正好适用于因果推理,简而言之,先验建立的因果图可以根据收集的数据进行修正,进而成为一个反映外部世界真实因果结构的图形。一旦建立因果图,科学家就可以跃进到数据发现的第二和第三层。因此,贝叶斯推理和因果图构建的结合是珀尔工作的重点。接下来几章将表明这一点。