(01)感受——写作是深入的阅读
阿尔法狗战胜世界级围棋高手李世石,发生在一年前的这个重大事件引起了我关于机器智能的极大好奇,还有他意味着什么,未来会带来哪些深远影响。
当我看到吴军老师的这本书时,在好奇心的驱使下,在网上下了单。
尝试按照网上介绍的快速阅读的方法,大约三个小时就看完了。随后开始写读书笔记,但这一写前后整整用了近两天的时间,许多内容或忘记或模糊以至于无法下笔,在写的过程中,此外脑子里不时冒出一些看书时没有想到的问题。于是,又拿起书带着问题重新看。
写作是深入的阅读。
经历这个过程让我对这句话有了进一步的感受。
(02)智能、智能时代是什么?
这个问题,吴军老师在书中并没有讲,又或者我没有看到。
百度百科是这样描述的:
从感觉到记忆再到思维的过程称为智慧,
行为和语言的表达过程称为能力,
这些全部的总和称为智能。
根据这个定义的描述,显然我们人类很久很久以前就拥有了智能。
那为什么是现在这个时代被认为是智能时代?
却不是很久以前呢?(比如,山顶洞人时代、夏商周、秦汉、唐宋元明清…)
所以,智能时代应该偏重或者特指机器智能。
像围棋这种一直被视为高智商的东西,AlphaGo也玩的转,并且它还把围棋大牛李世石赢了,这样的标志性事件就是机器智能的典型案例。
还有科幻类大片中的场景,主角们各种炫目的高科技,让人根本分不清是人还是机器人,这感觉就像我们中国人看老外都蓝眼睛黄头发,傻傻分不清楚差不多。
(03)机器智能是什么?
书中对智能时代的描述是,机器拥有像人思考的智能。机器像人一样,这究竟是一件让人感觉恐惧还是应该高兴的事情呢?
此外,关于机器智能有个普遍通行的标准是图灵测试。
看过一部关于他生平事迹的影片,这位哥搞出了一台庞大且看着笨拙的机器,破译了德国的电码,为盟军提供了大量德军的军事行动信息。
图灵在1950年提出了验证机器有无智能的判别方法,图灵测试。
A和 B分别是幕后的机器和人,裁判C同时与幕后的机器和人进行交流,如果裁判C无法判断自己交流的对象是机器还是人,则机器和人具有同等的智能。
今天的机器在语音识别、机器翻译、自动回答问题等方面,按照图灵测试的标准,显然普遍拥有智能。
(04)配套技术成熟引发拐点
机器智能,其实早已不是新生事物,这个概念已经诞生半个世纪了。
蒙娜丽莎这幅世界名作,让达芬奇家喻户晓。但,达芬奇不仅是画家,人家还是天文学家、工程师、发明家,还有特斯拉,同样是发明专业户。只是,他们的发明创意太超前,甩掉当时社会生产力水平上百年。
摩尔定律下的硬件设备不断升级,互联网和移动互联设备源源不断的产生出大量数据。配套技术已经成熟,让当年的机器智能在当今时代真正焕发生机。
(05)让机器具有智能,怎么做到的?
机器可以像人一样思考吗?
如何让机器通过图灵测试、拥有智能?
人类在寻找解决办法的过程中曾走了一些弯路,但最后一个看似特别笨拙的方法,运用到计算机上却特别好用,这就是“穷举法”。
例如:
盒子里装了很多张纸条,其中一个里面写有正确答案。那我只要把盒子里所有的纸条都翻看一遍,那我自然就找到了答案。这就是穷举法。对人来说,这是个费力耗时的苦差事,但对计算机却不然,它每秒可以计算上亿次。所以,穷举法对计算机是个很容易的事。
接下来,一件神奇的事情发生了。
降维处理,将智能问题转化为数据问题。也就是用数据驱动的方法,让机器具有智能。
案例1:
AlphaGo能战胜李世石,是因为它有一千多块CPU及一百多块GPU可以提供高效运算,现存棋谱可以提供完备的数据库。所以,这就是变智能问题为数据问题。
案例2:
现在如火如荼的自动驾驶,就是将智能问题转变为数据问题。
要想汽车实现自动驾驶,核心要点:
1、拥有城市的完备信息数据,
2、拥有传感器实施反馈交互信息,
3、拥有高效CPU进行高效计算,实时处理信息。
(06)机械式思维
瓜熟蒂落,说明事物的发展规律。当苹果砸到了牛顿智慧的脑袋上时,规律被发现了,并且被一个简洁的数学公式所表述:
对此,我们都应该是很熟悉的了,这就是我们中学时都已经学过万有引力定律。
天文学家利用万有引力定律计算结果与天王星实际运动轨道存在一定偏离的现象,预测在其轨道外还有未发现的新星,就是后来海王星,后来,科学家利用这一原理还发现了冥王星。
以万有引力定律为代表的我们学过的科学知识,说明了以下几点,同时也是机械思维的核心思想:
机械思维的核心思想:
第一,世界的变化规律是确定的。
第二,规律不仅可以被认识,而且可以用简单的公式来描述。
第三,规律是放之四海而皆准,可以用到各种未知领域指导实践。
(07)采摘不确定性的果实
果树中低矮处的果实已被采摘的差不多了。人类开始更高处的果实,不确定性。对于不确定性,有这门课程《概率论与数理统计》进行针对性的系统介绍。
采用随机事件的方法进行问题处理
我认为是这门课程的精华,进而改变了我们看待问题的思考方式。用吴军老师书中的话叫“从因果关系到相关关系”。
一家超市,采集客户购物数据并根据物品相关性,预测一位高中女生怀孕的故事,大家应该都已看到过。这就是相关关系应用的典型案例。
此外,关于不确定性,典型的领域是原子所在的微观世界,有一门高大上的学科——量子力学(此处省略N个字,因为对这个领域实在是不懂)。
(08)信息熵
熵,这是热力学第二定律中的一个概念,由德国物理学家克劳修斯于1865年所提出。香农首次将其引入到信息通信领域。
这个概念的简单理解就是,将信息引入一个系统,则其熵值将下降,系统的不确定性将降低。也就是对引入信息降低不确定性,给予了数学证明,这是我的粗浅理解。
现在数据量日益丰富,基于香农对于信息熵的研究成果,大数据便拥有了坚实的理论基础,大有用武之地。
(09)智能时代—我们怎么办?
通过上面的分析,总结为以下三点: