本来今天打算好好休息,不写文章的。
之前一段时间每天一篇五千字以上的长文,破万的也时有发生,之所以能这么高密度地产出,主要是因为放假了,哇哈哈哈哈。
紧接着上班后,几乎每天写一篇总结,虽然有自己做的插件助阵让工作简化了不少,但由于文章要一篇篇看过去然后写评语,所以脑细胞依旧死得很厉害。
今天难得什么事的没了,打算休息休息,明天再继续写文,但奈何楼上的小夫妻混合双打太孔武有力,墙壁都腾腾腾地作响。一旁是娃娃的哭喊,一边是男女混合肉搏,周遭是家具与墙壁的奏鸣曲,这画面太美我实在不敢看。
所以,既然休息是休息不成了,那就索性写文吧。
PS:这是这对小夫妻住进我家楼上这么多年以来第一次发生如此暴力事件。以前这女主人心情好从七八点开始骂男主人骂到十二点,心情不好就骂到凌晨两点,这男主人也从来不曾动过手,最体现其男子汉气概的一次也不过是回了嘴,然后那天被骂到凌晨四点。这次不知为何居然上演了全武行,我只能说就算是王八也有不要命发飙的时候,大家还是别太娇纵自己的脾气为好。
OK,今天的话题是一个很古老的问题,那就是“数学不可思议的有效性”。
这个话题当然不是第一次有人谈论了,事实上就算是我自己也不是第一次写文谈这个了。但这次要说的却是从另一个角度来看的这个问题——当然,也不算太新。
先让我们来看一下什么叫做“数学不可思议的有效性”。
这一问题的由来,源自这么一个我们无法否认的事实,那就是作为最成功的自然科学的那些学科,无一不是高度数学化的。
比如,被称为自然科学的基础与核心的物理,就是全然数学化的——非但是数学化的,人家理论物理还开始追求其形式化来,也就是力求不单单是物理量之间可以用数学公式来刻画,连整个理论体系都能用数学的语言来描述,也即将理论完全用形式逻辑的方式重写,每一条都符合形式逻辑,所有的公式都在数学上毫无瑕疵——这点并不是必然能做到的,比如到目前为止在实验上被以最高精度反复验证从而被称为“史上被实验验证得最彻底”的量子电动力学,其最最基本的数学公式在数学家看来就是一砣谢特。
每每想到此事总不免无语望苍穹呵呵复呵呵。
不仅及物理如此,天文与化学也在很大程度上做到了这一步。
地理和生物在这方面差一点——曾有物理方面的狂人科研者戏称生物在他看来不过是“一门收藏与汇整的艺术”。当然,一般说出如此大话的人都没什么好下场,比如以前有人说只要给一台足够牛逼的计算机就能用量子理论算出所有的化学实验,然后我们知道就算是现在你也做不到这点……
而即便是过去被认为完全不具备“科学性”的人文社会领域,数学的触手也逐渐伸入其中,比如在经济领域的数学是越来越显著了——曾有人说本世纪出的经济大崩溃的主要原因就是华尔街用的一条数学公式用错了……
而就算是社会学,统计这门数学工具的作用与力量也日渐显现了出来。
因此,所谓“数学不可思议的有效性”,其实就是说明了这么一系列问题——
1,我们似乎总能用数学来反映我们所关注的对象之间的相互关系;
2,基于上述关系我们总能以让人惊讶的准确度预测一件还没发生的事会如何结果。
其中,第一点可以被理解为“理论总能以数学为语言”,而第二点其实本质上是“理论”的特性——理论其实就是一种基于已知来分析本因再推测未知的暗箱技术——所以上面两条又可以表述为:
1,理论总能以数学为语言;
2,理论总能与实验相容。
因此,要理解数学的有效性,就要理解理论的有效性,以及,理论为何要以数学为语言。
任何一门基于自然的理论(对,我们现在自然科学入手),都可以被这么描述:
以一组先验预设为基础的,逻辑上自洽的系统,并能在适用范围内、误差容许范围内与实际相符。
无论是物理还是化学,其中的理论都可以用上面这段话来套用。
第一个分句表示任何理论都需要有一组基础假定(就比如数学中的那些公设。公设未必就是固定不变的,比如有人把几何学第五公设一换,就从欧几里德几何换出了黎曼几何),第二个分句则是对这个理论体系做了一个约定:逻辑上自洽的。第三个分句则道出了两点:一,理论有适用范围,超出范围就不适用;二,理论与真实之间不是严丝合缝,而是存在一定的容差范围。
这几条和在一起,我们就对理论有了一个大致的概念——理论本质上并不是真相的对应物,仅仅是在可验证的范围内与真相“相差不大”。
理论本质上基于假设,而假设对不对,理论无法告诉你,只能看是否会得到与真实不相符的理论结果,可就算相符我们也不能说这假设就是对的,说不定仅仅是因为凑巧没发现不相符的情况罢了。
此外,理论都有适用范围,而不是放诸四海而皆准的。
而,最关键的,就是理论必须在逻辑上是自洽的——也就是不会自我矛盾。
可,为何理论必须是逻辑上自洽的?
这其实又可以分出两个子问题——
一,理论为何需要逻辑自洽?
二,为何是逻辑的自洽?
这两个问题就不怎么好回答了。
事实上,由于我们所有的回答都必须基于我们的经验,于是就会遇到这么一个难题——你凭什么说根据你的经验,根据人类的经验,根据经验中的“理论需要逻辑自洽”,就认定所有的描述自然的理论都需要逻辑自洽?
这个问题可以非常无理取闹地一直追问下去:凭什么你根据人类万年都不到的经验就认定宇宙中所有的自然所有的现象它们所对应的理论都必须是符合人类自身经验总结而来的逻辑的?
面都这个问题人们突然有一种“说得好有道理我竟无言以对”的挫败感。
这就是扩大化的休谟疑难。
既然经验并不等于真理,也不能导出真理,那么你凭什么认为你对描述真理的理论的限制是合理的而非无意义的?
这样的无论是看上去还是想起来都非常有道理的诘问很容易让思考着滑入不可知的虚无深渊。
休谟试图利用数学与理性来回答这个问题,可结果却是连数学与理性都被怀疑了。
因此,让我们暂时跳脱这个问题从外部来看,这样的局面其实也从一定程度上回答了最初的那个问题——为何数学具有不可思议的有效性?这个问题的答案可能恰恰是:我们是这么选择的。
事实上,还有很多类似的约束条件我们还没有放到上面的对理论的描述中去,比如我们一般都相信理论所描述的真理或者说规律是“恒定不变”的,我们不认为朝令夕改是自然的本性,因此如果我们发现一套规律居然朝秦暮楚朝三暮四,那唯一的可能是我们并没有真的触及到这个现象的本质,而仅仅是将一个现象当成了规律。
除了要求自然规律在时间上是恒常不变的,我们也要求自然规律在空间上是处处相同的,而且是各向同性的。
研究自然的大部分人都相信真正本源的规律一定是尽可能简单的,具有某种美感的,甚至认为是能将芸芸世间一切现象都统一在一条基本规则之下的。
我们对理论有着各种各样的期许,相比来说,逻辑自洽,保持恒常,大概已经算得上是极其简朴了。
可所有这一切在那个休谟式的诘问下都会显得不那么可靠起来——为何这些基于人类经验的这些形而上原理,居然对“真理”是有效的?
所有这些问题说白了都可以用这么一个问题来概括:
你如何证明你通过前10000个数据所获得的规律,对这无穷个数构成的序列是成立的?
因此,这就回到了之前的那个结论兼问题上来了——数学不可思议的有效性的根本原因,是否可能仅仅是因为我们就是这么选择的?
让我们试想这么一种情况:一个描述自然的理论本质上不是逻辑自洽的,是完全不讲逻辑的,但它却依然可以在人类至今为止的所有实验中都与实验获得完美的匹配。
那么,我们是否会选择这样的理论来作为我们研究与发展后续理论的基础?
当然不可能,至少不是最可能的选择。
毕竟,理论作为一项工具,其工具属性本身就要求了理论要具有可预测性——而这种完全不讲逻辑的理论是不具备可预测性的,所以这样的理论作为工具是不合格的,因此作为理论是甚少被人考虑的。
因此,现在人们并不是以“是否符合真实”为筛选的原则,因此无论不讲逻辑到底是不是自然的本性,仅仅从工具性的角度来说,这种不讲逻辑的理论就不会被太多人考虑。
故而,理论的演化过程实质上还是人的选择过程,而不是趋近自然与真实的过程——这两个过程到底有多大差距,这个问题实在不好说。
有了这么一个认识,让我们回过头来看数学作为理论语言的问题。
既然理论的演化主要依赖于理论研究者的人为选择而非与不可知的真实之间的相符程度,而这种人为选择的一个最大依据就是是否具有更好的工具性,那么我们自然可以想到,如果一个理论可以将对象之间的关系尽可能简化,同时又能提供一种合理的外推方式,那么这样的理论自然是值得大家亲睐的。
比如说,在人类发展的早期,将种种自然现象归结为几位神祗的喜怒哀乐以及彼此之间纵横交错的互动关系,就是一个非常好的理论化方向——这可比面对不计其数的自然现象每一个都创造一个说法靠谱得多。而且这样的理论又能很自然地外推出要避开某些危险的自然现象就要讨好相应的神祗这么一种非常具备可操作性的外推结论,所以在当年作为一套理论来说真的是太好了——至于打雷闪电到底是不是雷公电母之间的交合,还是云层中正负荷电粒子的放电,这个就不重要了。
蒙昧的神祗时代之后,人类发现与发明了数学。数学这工具比神祗性格曲线表可好太多了,需要控制的对象可以精确量化,这本身就比揣测神祗的情绪具有更高的可操作性。
因此,我们用数学这种语言所描述的规律到底多大程度上接近真实,这个问题已经不重要了,重要的是:我们现在有了更好的工具来建立理论,并通过所建立的理论来分析和预测事物的发展,这种能力的最大化过程才是理论发展的真正原动力。
从而,为何理论要以数学为语言?这个问题很大程度恰恰就是因为使用数学为语言足够方便,而不是因为足够正确——同样的实验结果可以有大量不同的理论来解释,所以实验本身并不能唯一给出正确的理论,只能筛除那些足够不正确的理论。
事实上,就算我们要求实验和理论必须100%符合,这也不表示实验就能唯一锁定“正确”的理论,毕竟能给出相同结论的理论可以不止一个,比如说我们有很多量子理论的诠释体系,彼此不同,但却拥有完全一样的数学形式,于是在实验上是无法区分的。
既然实验无法筛选理论,至少无法筛选到唯一确定的状态,那么就是说,我们其实根本不可能做到100%确定的让理论的演化方向是朝着真理的方向去的,因而理论的演化方向就在很大程度上是人为掌控的了。
换言之,是人的选择而非自然的选择让理论长成了现在这样。
好了,如果我们现在有一群人,他们与我们是如此之不同,以至于他们所热衷并推崇的就是那些毫无逻辑可言的程序,那么对他们来说,他们会感叹的一个问题就是——无厘头不可思议的有效性。
因此,站在一个预设了“关于自然的所有先验与超验预设都不可信为真”这么一种怀疑论的前提后,我们发现数学的有效性完全就来源于人们对于理论的诉求而发展来的演化决策,从而是完全非自然的。
那么,这一充满怀疑论调的前提到底多靠谱呢?
这个问题本身就难以回答,因为我们所有的经验都是基于将这一前提去掉的理论体系的且都是有限的,而除去这些经验后的思考都是形而上的,因此本质上来说我们无法回答这个问题,就如我们无法回答休谟疑难一眼。
那么,我们又是否可以完全不考虑这一前提,就这么任性放肆地用下去呢?
原本我认为这或许不是什么大问题,因为自然科学已经取得了非常辉煌的成就,因此数学的有效性已经变得无需怀疑,直到后来我发现还存在大数据与复杂系统这样的东西的时候。
大数据领域有一个很著名的例子,大致来说是这样的:
猪王国有一头很聪明的猪,分析为什么每天早中晚三餐都有美食从天而降。他通过数年的观察统计与分析,最后得到的结论是:这是自然规律,美食就是每天三次准时降临,这是自然的一部分,而且这样的情况还会永远存在并持续下去。得到如此美妙结论的第二天,屠夫就把这头猪抓走宰杀吃掉了。
这一故事其实就说明了一个很简单的道理:黑天鹅的出现可以粉碎一切数学推论。
因此,在这类情况下,数学就显然地失效了。
如果数学真的还如其在自然科学领域一般神奇的话,它理应告诉猪博士屠夫的存在,但实际上我们知道这是不可能的。
倘若这不能算作是数学的失效,而仅仅表示我们对于初始状态的线索还不够齐全的话,那么大数据与复杂系统的另外一些现象大概就更能说明问题了。
我们在这些领域总是感叹数学的不够用——事实上,有很多人都表示过去人们所适用的基于有限几组公式的数学现在可能是完全不使用了,因为在复杂网络的大数据世界中,有多少数据,就有多少独立的彼此不同且不能规约的系统,就有平方量级的相互影响,立方量级的三体交互,等等等等。
说到底,我们发现我们完全无法像过去一样为如此海量的数据建立一个只要几个抽象对象之间相互作用关系的数学公式。
或者还可以这么说:面对数以万计的数学公式与对象,我们完全丧失了处理能力。
这种量级带来的无能为力,是否能表述为数学的失效呢?
比如说,我们有一亿颗小球,任意两颗球的属性的种类与量值都不相同,且差别之大到了无法被归类的程度,那么请问如何描述这一亿颗小球的运动?
过去的统计力学都基于系宗中的对象可以被归结为有限且数量不多的几个类别,每个类别都可以看作是大量近全同粒子。可以但我们发现每个粒子都分属一类的时候,这统计的大前提就丧失了,于是我们发现虽然我们可以做到为每个粒子都建立一个数学模型,并为每一对粒子建立一个相互作用的模型,但要描绘这一亿个粒子的运动,无论是整体的还是个体的,这都成为了不可完成的任务。
这算不算数学的失效?
因此,这就牵扯出另一个更有趣的话题了——如何定义“有效”?
如果说前面我们已经意识到我们的理论之所以如此仰仗数学完全有可能是人为选择的结果而非自然选择的结果的话,那么现在我们不得不停下来想想,当我们说“数学有效”的时候,到底什么算是有效?
如果说能给出结果并与实验相比符合得不错,这个叫做有效的话,那么前面一亿个小球的例子就显然是无效了——可我们真的这么认为么?
我们所认为的有效似乎更像是这样——无论实际计算上是否可能,至少原则上可以给出一个结果,且这个结果原则上估计下来可以和实际获得的结果具有容错可接受范围内的匹配度,那么就称之为有效——你看,我们已经将标准降低为“原则上估计会有效”了。
如果说之前所说的有效是“清有效”的话,那么这个大家更普遍接受的有效就是“浊有效”。
而事实上,我们所遵循的逻辑是这样的:数学在过去一直获得清有效的荣誉,因此在这里只要能获得浊有效,我们也认为它是有效的。
因此,就是因为“原则上我们只要为这一亿个小球分别做计算,计算结果总能给我们一个满意的答案”这样的信念的存在,使得数学在这个问题上的无能为力被归结为“实际操作上的不可为”而非“理论上就做不到”,从而我们依然相信数学是有效的。
可,真的不是“理论上的做不到”么?
比如,现在如果要你描述这一亿个小球的状态,你要怎么描述?
统计平均已经在设定中被否定了。所以,似乎我们只能将这一亿个小球的一亿个状态与属性都列出来,这样才算是描述了整个系统了?
这与理论本身所需要的抽象性不符。
但这会被我们视为数学的失效么?
貌似不会。
但我们却地的确确无法使用数学作为有效语言来描述这个系统,理论所要求的抽象概括能力丧失——因此,要么我们认为数学失效,要么我们承认现在理论所用的语言不能是这种数学了——虽然我们并不知道还能选什么。
当然,就算我们选择数学在这个问题上失效,似乎也无伤大雅——我们可以说我们还会继续发展更加合适的数学,以实现这为一亿个小球做描述的艰深任务。
但,这就让我们的问题变成了——即便数学现在失效了,我们也总能期望出现更好的数学理论与工具来维护数学的有效性。
因此,所谓数学不可思议的有效性,其实面临着三朵乌云。
一,我们对数学的选择完全有可能是人为选择的结果而非自然选择的结果,因此数学的有效性的根源是人们选择了数学,更是因为人类选择了现代科学理论奉为圭臬的那套基本公设;
二,数学也面临着或许理论上可行但却在操作上的确做不到的窘境,此时有效性的根源是基于过往的有效而对未来有效的愿景;
三,即便数学在现在真的失效了,我们也会期望出现更好的数学理论来弥补现在的失效,这一信心同样源自过去的辉煌成就。
显然,后两点其实指出了同一个问题——数学不可思议的有效性或许很大程度上来自过去的确很有效,而未必是现在依然很有效。
比如说,面对真实世界人类社会这么庞大的复杂系统,我们现在所有的数学工具都只能做到初步的统计与不怎么准确的预估——微软等大公司的那些很出彩的统计预测也仅仅只能针对一些特定的领域而非整个人类。因此,这样的局面到底意味着数学遇到了不可及之处,还是仅仅是让我们相信未来会有更牛更好的数学工具呢?
至少对于那头王国里的猪来说,数学并不能帮助他逃离屠夫的魔掌。
说到底,数学的有效性,恐怕很大程度上是因为我们的研究方法是高度数学化的,以及,到目前为止在我们高度数学化的研究方法下,它和实际情况符合得的确很好。
至于说真实的情况是否是数学的,是否是我们所用的数学的,这个只能说:还没有足够的信号来告诉我们答案是不是,但我们也不能100%肯定的说是,只能说在容错范围内还不用选择不是这个答案。
如果你觉得这篇东西写得还行,愿意打赏我一口咖啡,请戳打赏页~~
本文遵守创作共享CC BY-NC-SA 3.0协议**