最近往某期刊投了一篇文章,专家给的审稿意见大致是文章有新意,但模型构建不精确。不得不承认,文章中我的确没找到比较好定量的模型构建方法。这两天阅读了几篇关于科学研究范式的文章后,发现可能问题不完全在我,而在于我们从事科学研究的范式正在转型,用传统的“模型推导”的标准来评价目前的研究成果可能有失偏颇。
现在对于科学研究范式比较有影响力的是吉姆·格雷(图灵奖得主,关系型数据库的鼻祖)提出的四类范式(Paradigm,某种必须遵循的规范或大家都在用的套路),依次为实验归纳,模型推演,仿真模拟和数据密集型科学发现(Data-Intensive Scientific Discovery),其中,最后的“数据密集型”,也就是现在我们所称的“科学大数据”。前3个阶段,目前看争议不大,但“数据密集型科学发现”是否能称为科学研究范式4.0还存在比较大的争议,复杂科学研究圣地圣塔菲前所长韦斯特就认为,“数据密集型科学发现”只能称为科学研究范式3.1。
1.“实验科学”(第一范式)
人类最早的科学研究,主要以记录和描述自然现象为特征,称为“实验科学”(第一范式),原始的钻木取火,中国的瓷器制造、指南针和火药等的发明都是这一阶段的研究成果。
2.“模型科学”(第二范式)
后来以伽利略为代表的文艺复兴时期的科学发展初级阶段,开启了现代科学之门。
但这些研究,显然受到当时实验条件的限制,难于完成对自然现象更精确的理解。科学家们开始尝试尽量简化实验模型,去掉一些复杂的干扰,只留下关键因素(这就出现了我们在学习物理学中“足够光滑”、“足够长的时间”、“空气足够稀薄”等令人费解的条件描述),然后通过演算进行归纳总结,这就是第二范式。这种研究范式一直持续到19世纪末,都堪称完美,牛顿三大定律成功解释了经典力学,麦克斯韦理论成功解释了电磁学,经典物理学大厦美轮美奂。但之后量子力学和相对论的出现,则以理论研究为主,以超凡的头脑思考和复杂的计算超越了实验设计,而随着验证理论的难度和经济投入越来越高,科学研究开始显得力不从心。
3.“模拟科学”(第三范式)
20世纪中叶,冯·诺依曼提出了现代电子计算机架构,利用电子计算机对科学实验进行模拟仿真的模式得到迅速普及,人们可以对复杂现象通过模拟仿真,推演出越来越多复杂的现象,典型案例如模拟核试验、天气预报等。随着计算机仿真越来越多地取代实验,逐渐成为科研的常规方法,即第三范式。
从模拟仿真计算方向来看,现有可商业化技术已经覆盖了除了人以外的几乎所有自然、物理、工程等领域:太阳黑子爆发模拟、大气运动模拟、城市三维地图……唯独一个领域,在商业实践层面模拟仿真难以覆盖到——就是有“人”的社会性领域。
4.“大数据科学”(科学范式3.1或者科学范式4.0)
而未来科学的发展趋势是,随着数据的爆炸性增长,计算机将不仅仅能做模拟仿真,还能进行分析总结,得到理论。数据密集范式理应从第三范式中分离出来,成为一个独特的科学研究范式。也就是说,过去由牛顿、爱因斯坦等科学家从事的工作,未来完全可以由计算机来做。这种科学研究的方式,被称为第四范式。
5.“模拟科学”与“大数据科学”的异同点
显然,两者的研究都需要依托计算机进行,都是“人脑+电脑”,主要区别在于前者中人脑是主角,后者中脑是主角。
6.小结
从科学范式的发展来看,城市系统是一个复杂巨系统,因为涉及到人,在前3个范式阶段都没有很好揭示出规律,随着移动互联网和大数据技术的发展,现在科学研究者已经能够较好的记录人的活动,通过大量的数据挖掘,揭示城市这个复杂系统背后的“隐秩序”。城市也是因为复杂,所以难以用第二范式中的模型推理进行研究。国内的《城市交通》杂志就是一个很好的例子,这个期刊上的文章,很多都没有严格的数学推导,但很多都是理论和实践的结合,能比较好的解决城市交通方面的各类问题,因而受到了城市交通领域研究人口的高度认可。而那些追求严格数学推导的期刊不怎么收到大家的欢迎,这些文章为了实现数学上的表达,结果的可计算,对大量的因素都进行了简化,已经无法正常刻画城市的运行。此外,在时间维度上,城市是不断生长的,而传统的很多数学公式在这一点上是无能为力的。
从科学研究的发展阶段来看,城市研究正处理“模拟科学”和“大数据科学”的阶段,这一类应该的成果不应该再用“模型科学”的标准来评判,我们不能用20世纪的标准来衡量21世纪的科学研究,就如同我们不能用要求小学生的标准来要求大学生一样。
参考文献
1.第四范式:基于大数据的科学研究.https://mp.weixin.qq.com/s?src=3×tamp=1553786053
2.全息计算打造“公司大脑”;简单规则驱动复杂系统.https://zhuanlan.zhihu.com/p/36265842