前言:
我们无法想象,一个快马加鞭传递三百里加急的信件的信使看到我们今天拿起智能手机一秒之内传递讯息的震惊。我们也曾对着智能机器人像个孩童一样问东问西——虽然它懂得比你想象的多得多。当我们看到铺天盖地的新闻说阿尔法狗打败了李世石,人工智能要改造这个世界。
一、 电脑一思考,人类就尖叫——一台用来计算的计算机,为什么突然学会了思考?
我们把计算机叫做电脑,既然称之为“脑”就说明在人们眼里,计算机像大脑一样在思考。哪怕是简单的1+1=2的计算。当然,计算机思考的背后还是人类的思考。但是,就像我们坐过山车一样,除了最初的推动力,其他时间,过山车靠的都是地球引力在运动,电脑在最初的步骤里,是需要人类设定程序来计算,但是,当它进入一个更高深的层次,发现规律并且自我运算的时候,计算机就开始自我赋能了。
当我们教别人如何做事的时候,首先会在脑子里将事情的步骤想一想,然后用“编码”——语言一二三地总结出来传授,最后让他做一遍验证一下学会了没有。人类要如何“教会”计算机做事呢?
教会计算机按照人类思维模式做事,是不是可以将此理解为智能的开端?智能换个词就是智慧,智慧的意思是辨析判断、发明创造的能力。书中讲到智慧行为一般包括两个部分:搜索+评估。
任何生物要想生存,一定要有对生存环境的判断。哪里有危险,哪里能吃到东西。这种判断换句话说就是“多看一步”——预测未来。这种预测最行之有效的,就是抛弃一切主观意识和价值判断,对事物的发展进行推测——有一个词概括了这种判断和推测:仿真,就是基于现有状况机械地推测今后的变化。
搜索是进行仿真的前提。计算机的搜索功能会用让它搜索到正确的选项,在下棋的时候,搜索就意味着,找到一个正确的落子点。
当我们到喧闹嘈杂的菜市场,如何才能快速确定谁家的菜新鲜便宜呢?初入菜市场的你,评估的结果一定是:顾客最多的那家。电脑对下棋也需要评估。电脑将整个资源进行切割,在切割后的各个部分里,再进行搜索并且对评价较高的部分进行进一步的搜索。这就像我们分解目标各个击破一样。
二、 了解人工智能之前,必须要了解的深度学习。
如何让计算机知道这张图片狗是狗而不是猫?就像妈妈对你说的,要学习才能知道更多,把学习的任务交给电脑,这种方式叫机器学习。在创新工场CEO李开复著的《人工智能》一书中,对机器学习有一个定义:机器学习……是一种用数学模型对真实世界中的特定问题进行建模,以解决该领域内相似问题的过程。
仔细看一遍这个概念,不要被里面的专业名词吓跑。通俗一点理解,就是像我们人类学习汉字一样,从天地人日月星开始,从不会到记住,一次一次地记忆,当我们看的次数足够多时,这个字就印在脑海里了,下次,不管这个字是楷体还是宋体,不管是毛笔写的还是钢笔写的,我们不会认错。计算机也是用这个规律来记忆的。
到今天,机器学习在画像识别领域技术已经比较成熟了。比如人脸识别技术,或者你打开某一个软件扫一扫,就能知道任何一朵花儿的名字,或者你在淘宝上用图片搜索卖价更低的商品。在这里,我们要说的是机器学习中的深度学习。
三、 什么是强化学习?
有两种学习方式:监督式学习和强化学习。顾名思义,监督式学习就是有老师看着学,而强化学习不需要老师,计算机会对未知的环境进行随机搜索并反馈其结果。在反馈结果的过程中,“评估”被不断强化,所以这个方法就被叫做,强化学习。
当这种强化学习技术运用到将棋领域的时候,将棋出现了人类可以永远都想不出来的“棋路”——计算机自我发明了新的棋路。事实上,这些结果是建立在最初大数据输入的前提下的,监督式学习让电脑学到了最前沿的技术,然后才能强化学习。其实简单点说就是,人类教会了计算机之后,计算机逐渐超过了师傅,开始自学成才了。当徒弟开始领悟规律,老师恐怕就真的追不上了。
阿尔法狗就是很好的例证。围棋在进入电脑评估的时候,因为其棋面的复杂多样性,每一步是很难用分值来计量。这时候,一种叫做蒙特卡洛法的运用随机效果来进行推算的方法出现了。
其实从概念可以看出,这是一种看起来麻烦但是能够在不确定性中找出答案的方法,对于围棋这样很难找到规律和计算方法的棋艺来说,这种方法是非常恰当的。阿尔法狗也是通过蒙特卡洛法,深度计算的结合,掌握了围棋的方法战胜人类的。
最后:
当人工智能一步一步走进我们的生活,变得比人类更聪明的时候,人类难免会产生担心,从普通人担心的工作被枪占,到人工智能专家担心人工智能缺乏伦理观,做出无法被人类控制的事。这也的确为人工智能的发展敲响了警钟,人类为了便利而将人工智能推向了今天,但是说到底,人才是一切的根本,对此,我们要永远记住并且遵循。