谷歌开发的“阿尔法狗”打败世界顶尖围棋高手李世石,让“深度学习”再次成为头条。谷歌在深度学习上不惜重金投入,“阿尔法狗”是其深度学习项目的最新成果。谷歌的搜索引擎、语音识别系统和自动驾驶都极大地依赖于深度学习技术。此外,他们已经使用深度学习网络建立了一个程序,能在YouYube上抓取画面,作为索引图像。去年,谷歌宣布“智能回复”,这个系统能帮助你进行简剪短的邮件回复。
深度学习似乎无所不能,但又似乎有几分神秘。那么,深度学习到底为何物,有何用呢?
机器学习
“机器学习”和“深度学习”这两个词有时候被当作同义词使用,但是它们并不是一回事。深度学习是机器学习的一种,就好比骑自行是锻炼的一种。了解了机器学习,再了解深度学习就会容易的多。
机器学习经常被描述为“人工智能”(译者注:Artificial Intelligence,缩写AI)的一种。在人工智能环境中,是计算机学习去做某件事,而不是进行编程去做。举一个简单的例子,你可以用写代码的方式编程,让计算机在看到一张特定的猫的照片时,识别出这是一只“猫”。如果恰好这个程序见到的这只猫也是照片里的猫,那么这种方法非常奏效。然而,如果让程序去看许多种不同的动物,包括不同种类的猫,并且将猫从其他不同的动物中区别开来,这种编程的方法就不灵了。
机器学习的程序可以用不同的方式进行训练。比如,其中一种是给这个程序看大量的动物图片,在每张照片上标注处动物的名字。比如,所有猫的照片就标注上“猫”。最后,程序学习到长得像猫的动物就叫“猫”。这种方法不是去用编程告诉它这张猫的图片叫“猫”。
这个程序之所以能这样做,是因为学习了那些经常在一起出现特征的组合。比如,猫就一些看得见的特征——它们的体型、长胡子、脸,这些特征足以把它们与别的动物区别开来。程序学习是把这些不同的特征进行组合,与“猫”联系起来。这个学习的过程通常被叫做建模。
一旦建立了猫的模型,机器学习就用它没见过的照片测试这个模型。通过识别新的猫进行评价,并用产生的信息去调整模型,以便下次再识别猫的时候更为精准。新的模型随后不断被验证,识别的准确性被评估,以此再调整。这种迭代过程持续进行,直到建立的模型能够高精度识别猫。
深度学习
深度是也是通过机器学习的过程进行的,只不过它用的是由很多层级以分层形式组合在一起的人工神经网络(artificial neural net)。这个网络在初级层次学习到一个简单的信息,然而将信息传递到下一层。经过这一层到处理,将这个信息变得复杂,并传递到第三层。在每一个层级,这样的过程持续进行,进而构建出比上一个层级更为复杂的信息。
再以猫为例。深度学习网络的初级层级可能使用猫的图片中深色和浅色区域去学习猫的轮廓或线条。初级层级包含猫的轮廓的信息传递到第二层。在第二个层级,这些有关轮廓的信息被组合成简单的对角线或直角。第三个层级,这些简单的形状被组合成更为复杂的物体——比如椭圆形或长方形。而下一层级可能将这些椭圆形和长方形组合成发育不全的胡须,爪子或者尾巴。这个过程持续进行,直到达到最高层级,人工神经网络就学会了识别猫。在学习识别猫的同时,网络也在学习它看到的其他动物。
深度学习有何用?
深度学习吸引了很多人的眼球,是因为在现实世界中它的应用潜力巨大。前面介绍过,机器学习是用训练的方法将所有的图片标注上“猫”。测试和校对模型的每一步都要对图片上的标记和程序中的标记进行对比,从而决定程序的标注是否正确。这种训练方法称之为“督导式学习”(supervised learning)。
与机器学习中其他的训练技术相比,督导式学习相对而言速度快,而且计算量不大。但是它有一个致命的缺陷,就是现实世界中的应用。一个人每天使用社交媒体、硬件、软件服务协定、App准入条件和cookies数据包等产生的信息是海量的。这些信息无论在哪个层级都具有极大的商用价值。但问题是,这些所有的信息都无法被标记,也不能依靠督导式学习使用机器学习的方法去训练程序。如果需要一个人去标记这些数据,那么标记的过程将非常耗时并且昂贵。
相比之下,深度学习网络就能够避免这个缺陷,因为它们擅长的是非督导式学习(unsupervised learning)。督导式学习和非督导式学习最大的区别是,在非督导式学习中,数据不用去标记。即使猫的照片不用标记上“猫”,深度学习依然可以学习标识猫。其他的机器学习是不可同日而语的。
这种从非标记数据或非建构信息中进行学习的能力,对于那些热衷于现实应用的公司而言是天大的福利。对那些满怀想象,梦想挖掘非建构大数据宝藏的掘宝人而言,深度学习无疑为他们打开了这个宝藏之门。
深度学习可以用在知识发现、知识应用和基于知识的预测。换句话说,深度学习是产生应用结果的超强引擎。
我们看看那些使用深度学习系统创造出新鲜玩意儿的公司:
图像识别创业公司ViSenze开发了一种商用应用程序,让深度学习系统进行图像识别和标签,用户可以使用照片而不是关键词来检索自己想要的产品。
美国人工智能公司Skymind建立了一个开放式的深度学习平台,进行诈骗检测、用户推荐、用户反馈管理等。
Atomwise使用深度学习网络,进行新药物的研发。他们使用深度学习系统探索重新利用现有和正在测试的药物,以抵抗新的疾病。
Descartes实验室是美国洛斯阿拉莫斯国家实验室的一个孵化公司。他们用深度学习网络通过进行卫星成像分析,对食品生产和能源基础设施提供实时的信息反馈。
这些,只是使用深度学习开发创新、新鲜事物的很小一部分例子。
发现和识别我们周围世界中的模型和规则是科技进步的核心。它关乎我们如何进步,如何创新。同样,它也是深度学习所擅长的领域。问题不是深度学习是否有用,而是如何用深度学习去改进正在做的事情,或者,从已有的数据中发现新的价值。
——2017年1月2日星期一
注:
本文为译文,原文链接为:http://www.forbes.com/sites/kevinmurnane/2016/04/01/what-is-deep-learning-and-how-is-it-useful/#5dd74ae710f0
原文标题:What Is Deep Learning And How Is It Useful?
原文作者:Kevin Murnane,认知科学家、退休教授、音乐家、游戏爱好者、骑行者。历史学学士、历史与哲学硕士、认识心理学博士。
本文图片:均来源于原文。