很多时候,落后与先进的差距,不是购买一些机器或者引进一些技术就能够弥补的,落后最可怕的地方是思维方式的落后。 —— 吴军
第三章 思维的革命
思维方式决定科学成就:从欧几里得、 托勒密到牛顿
思辨的思想和逻辑推理的能力,依靠它们可以从实践中总结出最基本的公理,然后通过因果逻辑构建起整个科学的大厦。
把托勒密、伽利略的研究方法论做一个概括,其核心思想有两点:首先需要有一个简单的元模型,这个模型可能是假设出来的,然后再用这个元模型构建复杂的模型;其次,这个模型要和历史数据相吻合。
牛顿的机械思维核心思想可以概括为:
① 世界变化的规律是确定的。
② 规律可以用简单的公式或者语言描述清楚。
③ 这些规律应该是放之四海皆准的。
工业革命,机械思维的结果
机械思维的重要特性 —— 所有问题有一个通用的解决方法。
机械的广泛使用和机械的思维方式直接导致了人类迄今为止最为伟大的事件 —— 工业革命。
机械思维的核心思想可以概括成确定性(或可预测性)和因果关系。
世界的不确定性
并不是因为他们缺乏专业知识,而是由于不确定性是这个世界的重要特征,以至于我们按照传统的方法 —— 机械论的方法难以做出准确的预测。
熵 —— 一种新的世界观
“熵”的概念,来描述一个系统中趋向于恒温的程度。
信息量的度量就等于不确定性的多少,这样香农就把熵和信息量联系起来了。香农还指出要想消除系统内的不确定性,就要引入信息。
在信息时代的方法论:谁掌握了信息,谁就能够获取财富,这就如同在工业时代,谁掌握了资本谁就能获取财富一样。
① 香农第一定律讲的是,对于信源发出的所有信息设计一种编码,那么编码的平均长度一定大于该信源的信息熵,但同时香农还指出,一定存在一种编码方式,使得编码的平均长度无线接近于它的信息熵。香农的第一定律还有第二层意思,就是说一定存在一种(最优的)编码方法,使得每个汉字的平均编码长度可以非常接近它的不确定性(信息熵)。至于怎么才能做到,霍夫曼(Huffman)给了一个非常简单的方法 —— 只要把最短的编码分配给最常见的汉字即可。
② 香农第二定律,通俗地讲就是信息的传播速率不可能超过信道的容量。人脉就是人与人交往的带宽。现代通信手段的本质,就是以相对低廉的成本让人们获得人脉,而媒体行业的不断进步,本质上是不断地在为企业拓宽对外连接的带宽,使得它们做生意越来越方便。
③ 最大熵原理,这个原理的大意是说,当我们要对未知的事情寻找一个概率模型时,这个模型应当满足我们所有已经看到的数据,但是对未知的情况不要做任何主观假设。
大数据的本质
为什么大数据的出现能够解决那些智能的问题,因为很多智能问题从根本上来讲无非是消除不确定性的问题。
互信息 —— 为了获得相关性通常需要多个维度的信息。
当两个数据源完全一致时,它们的交叉熵等于零,当它们相差很大时,交叉熵也很大。
在无法确定因果关系时,数据为我们提供了解决问题的新方法,数据中所包含的信息可以帮助我们消除不确定性,而数据之间的相关性从某种程度上可以取代原来的因果关系,帮助我们得到我们想知道的答案,这便是大数据思维的核心。
也许你会喜欢: