家里附近的商场新开了一家盒马生鲜超市,门口结账区摆了好几个自助机器,和普通超市的机子有些不同的是,盒马机子上都装有摄像头,也就是你可以使用支付宝的“刷脸支付”了。
昨天晚上带着眼镜和帽子试验了一下,肉眼看摄像头捕捉到的图像并没有想象的高清,但一拍完屏幕上便迅速唤起了自己的支付宝账号。简单,方便,快速!
曾经像科幻一样的技术,怎么能一下子就进入日常生活了呢?
从如何认出一只猫开始
如果给你一张猫和狗的合照,你是否可以很快的判别出哪只是猫,哪只是狗?这对一般人来说是非常容易的,因为我从小就被教会了猫是长怎样的,狗又是长怎样的。
但如果让你给#猫#这个动物的形象做一个清晰的定义,可能会是十分困难的。世上猫的种类繁多,种类之间的差异十分巨大,并不是简单的几条描述可以说的清楚。而若要将猫的形象统一化,抽取共性,又似乎必定会丢弃许多的细节,有令其变得过分简单无法适应现实多样性样貌的风险。
而正因为如此,曾经我们认为运算能力几何倍数于人类的超级计算机,面对这个定义困境也无能为力,如若不给予计算机足够清晰又足够详细的判断标准,计算机也无能为力。
在整个人工智能发展的过程中,不仅是图像识别,机器翻译也遇到同样的困难。人类的日常言语千差万别,新的词语,新的语法每天都在出现,也很难以有限的规则穷尽所有的变化。
于是乎,我们发现,试图总结复杂的时刻在变化的事物规律,以“教会”计算机智能,这是一条死胡同。
大脑神经给予计算机科学的启示
如果总结规律行不通,那么是否有其他不一样的方法能教会计算机智能?
大家大致都听过,现在广泛应用的人工智能都是使用一种叫做“深度学习”的算法。16年谷歌子公司Deepmind的围棋AI- Alpha GO战胜韩国冠军李世石的让这一算法广为人知。而在经过仅仅18个月的发展后,旗下的游戏AI - Alpha Star在8年底又战胜了2个星际2的职业玩家。
到底深度学习是怎样的一种存在,让计算机一下子飞速获得了超越人类英才的智能?
其实深度学习恰恰是很好地借鉴了人类大脑的运作方式。在《深度学习 - 智能时代的核心驱动力量》一书中,作者谢诺夫斯基在研究神经网络计算模型时,便提出了大脑给予计算机科学家的四个暗示。
第一个暗示:大脑是个强大的模式识别器。人脑是否善于在一个混乱的场景中识别出重要的东西。
第二个暗示:大脑的识别功能可以通过训练提高。人类通过学习和刻意训练,是可以明显提升某一方面的认识和判断能力的。
第三个暗示:但是大脑在训练和识别的过程中,并不是按照各种逻辑和规则进行的。我们识别一个人,不需要具体测量这个人脸上的各个五官的形状与尺寸,一眼看过去,就已经识别完成。
第四个暗示:大脑是由神经元组成的,大脑的计算不是基于明确规则的计算,而是基于神经元的计算。
深度学习要做的,就是模仿大脑的这些特点和运作原理。
越努力,越精确
以下图片代表一个最简单的计算机神经网络。左边代表输入的信息,中间代表处理,右边是输出。中间和右边部分的每一个圆点代表一个神经元。
数据信息输入大脑后,通过隐藏层各个神经元的处理,把信号传递给输出层,输出层神经元再处理一番,最后做出判断。
那么在实际的计算机网络中,如何模拟这种神经元网络的运作呢。举个简单的例子,下面这张图表代表了一个根据交通信号灯判断要不要前进的神经元。它由三部分组成:输入,内部参数和输出。
简单来说,这是一个基于不同信息输入的计算过程,当最终计算结果大于0时输出“前进”命令,小于0时输出“停止”命令。在计算机模型中,每个神经元的这些内部参数,都是可以调整的。
简单来说,现在经常听到的“需要大数据”来训练AI算法的过程,其实就是调整和更新各个神经元内部参数的过程。整个神经网络机构在数据中不变,但其中神经元的具体参数才决定了神经网络的功能和表现。
现代社会的重要思维方式
按照以上谈到的人工智能发展过程,似乎是计算机算法向人类大脑思维方法进行了学习。但其实,深度学习的技术方法论恰恰是提醒我们要打破惯有思维。
不管是归纳或者演绎,总结规律,运用规律总是人类的本能。但在发展日新月异的社会中,每天万事万物都在发生变化,企图用一套固定的规则来指导事物运作的方法论可能再难以成功。
但我们依然可以基于对市场,经济和社会行为的一些基本理解,来设计一些做事的方法与模型。但注意模型必须考虑到多个复杂因素,并且各个因素都是可以及时灵活调整的。
基于实践的反馈,不停的调试自己的模式,最终发展出一套能灵活适应变化(大数据)的行事系统,便是基于个人的人工智能模式了。