来源:https://numenta.com/blog/2016/01/11/machine-intelligence-machine-learning-deep-learning-artificial-intelligence/
我们经常被问到如何将我们的技术与其他技术区分开来。由于没有一个一致的词汇,这个任务变得很困难;每个人都用不同的术语(和其他相关术语)。此外,这些术语中一些通常被理解的含义随着时间的推移而演变。1960年的人工智能与今天的含义完全不同。
在我们看来,构建智能机器有三种主要方法。我们称之为经典人工智能,简单的神经网络和生物神经网络(Classic AI,Simple Neural Networks, andBiological Neural Networks)。本文的其余部分将描述并区分这些方法。最后,我们将包括一个示例,说明每种方法如何解决相同的问题。这种分析是针对企业而不是技术用户的,因此我们稍微简化了一些,因此请求技术专家的纵容,他们可能会对细节吹毛求疵。
一、经典的人工智能方法
人工智能最早的方法是通过计算机程序来解决人类大脑容易执行的问题,比如理解文本或在图像中识别物体。这项工作的结果令人失望,进展缓慢。对于许多问题,研究人员得出结论,计算机必须拥有大量的知识才能“聪明”。因此,他们引入了“专家系统”,由领域专家提供规则的计算机程序,通过提一系列问题的方式来解决诸如医学诊断等问题。如果疾病没有得到正确诊断,专家会增加额外的问题/规则来缩小诊断范围。一个典型的人工智能系统对一个特定的问题高度关注。
IBM的沃森可以被看作是一个经典人工智能系统的现代版本。它专注于在特定问题上创建一个复杂的知识库。尽管沃森并不依赖于编码规则,但它需要领域专家的密切参与来提供数据并评估其性能。经典的人工智能已经解决了一些明确定义的问题,但它的局限性在于它不能自主学习,而且需要为个别问题创建具体的解决方案。在这方面,尽管它被称为人工智能,但它与一般的人类智力几乎没有什么共同之处。
二、简单的神经网络方法
一些早期的研究人员探索了人工智能的神经元模型。当经典人工智能的极限变得清晰时,这个概念得到了提升,加上反向传播技术,开始证明是有用的。由此产生的技术,人工神经网络(ANNs),是在50多年前创建的,当时人们对真正的神经元是如何工作的知之甚少。从那以后,神经学家已经学到了很多关于神经解剖学和生理学的知识,但是ANNs的基本设计几乎没有变化。因此,尽管名字是神经网络,但ANNs的设计与真正的神经元没有什么共同之处。相反,从生物学的现实主义到从没有人类监督的数据中学习的愿望,ANNs的重点已经转移。因此,简单的神经网络优于经典人工智能的最大优点是,它们可以从数据中学习,而不需要专家来提供规则。今天,ANNs是一个更广泛的范畴的一部分,称为“机器学习”,包括其他的数学和统计技术。机器学习技术,包括ANNs,查看大型数据体,提取统计数据,并对结果进行分类。
ANNs最近已经发展成为深度学习网络,它的发展得益于快速计算机和大量的训练数据。深度学习已经成功地解决了许多问题,如图像分类、语言翻译和在电子邮件中识别垃圾邮件。
虽然简单的神经网络系统可以解决许多不能用经典人工智能解决的问题,但它们也有局限性。举个例子,当训练的数据有限时,他们的表现不太好,而且他们不处理数据的模式不断变化的问题。从本质上讲,简单的神经网络方法是一种复杂的数学技术,它可以在大型静态数据集中找到模式。
除了传统人工智能和简单的神经网络的局限性之外,还有一个更深层更重要的问题。在我们看来,这两种方法都不是实现真正机器智能的途径;他们并没有提供路线图来实现,这就引出了第三种方法。
三、生物神经网络的方法
每个人都认为人类的大脑是一个智能系统;事实上,这是唯一一个大家都同意的系统。我们相信通过研究大脑是如何工作的,我们就能了解智力是什么,以及大脑的哪些特性对任何智能系统都是必不可少的。例如,我们知道大脑使用稀疏分布表示(SDRs)来表示信息,这对于语义概括和创造力是必不可少的。我们相信所有真正的智能机器都将以sdr为基础。sdr并不是可以添加到现有的机器学习技术的东西;他们更像是一个基础,其他一切都依赖于此。其他重要的属性包括记忆主要是一系列的模式,行为是所有学习的重要组成部分,学习必须是连续的。此外,我们现在知道,生物神经元比简单的神经网络方法所使用的简单神经元要复杂得多,而且它们之间的差异也很重要。我们相信,通过简单的神经元方法,你无法获得机器智能,但必须抛弃它,以更现实的生物学方法开始。
Numenta的技术,分层的时间记忆(HTM),是生物神经网络方法的最好例子。今天,HTM系统能够学习流数据的结构,预测和检测异常。他们不断地从无标记的数据中学习。通过采取一种强有力的生物学方法,大脑给我们指明了未来工作的方向,例如完成我们对行为、注意力和短期记忆的理解。该路线图将HTM与其他技术区别开来,并使其成为创建智能机器的最佳候选。
四、一个例子
让我们考虑一个问题,并考虑如何在三种不同的方法中解决它。为了区分这三种方法的主要区别,我们再次简化了一些。
我们被要求在一个组织中检测员工的流氓行为。例如,有机密信息的公司想知道内部访问的人是否在滥用这些信息。员工行为的改变可能是完全合法的——员工已经改变了角色,现在又有了新的责任——或者这可能是个问题。
流氓行为很难辨认。传统的人工智能方法将通过一系列规则来解决这个问题。例如,让我们考虑一个使用机密客户数据的分析师。传统的人工智能系统需要一个人来找出可能出现的问题场景,然后编写系统来寻找这些场景。这个解决方案可能会标记任何实例,分析人员在这个月访问客户文件的次数超过10次。随着经典人工智能系统的部署,假阳性和假阴性被检查,规则将得到加强。新规则可能会说,在一个月的头几天访问客户数据的分析员没有被标记,但是在这个月剩下的时间里。
简单的神经网络方法将从大量历史数据开始,即一个已知问题场景的大型数据库。例如,简单的神经元网络系统可能会发现,这种信息的滥用只发生在一个月的最后一周。该系统识别这些特征,然后将一个人归类为“不寻常的”或“不寻常的”。虽然这听起来很像典型的人工智能方法,但在这种情况下,这些特性是从数据中学习的,而不是来自专家。
这两种方法都有一些问题。有了经典的人工智能解决方案,你需要知道你在寻找什么。但是犯罪分子不断改变策略以避免被发现,规则也不适应。简单的神经网络方法需要大量的标签数据才能找到共同的特征,但是这种数据通常并不存在于不寻常的行为中。这两种方法都不适合建模个人行为,并要求系统在出现新模式时进行重新训练。
生物神经网络方法将会从每个分析人员(比如经常访问的文件的详细信息、电子邮件数量、发布的数量等)中传输数据,并自动构建每个人的正常行为模型。然后,系统将预测每个分析师的正常情况,并表示任何异常。可以在不知道哪个指标是重要的情况下对大量不同的指标进行一个接一个地建模,所有的建模是自动的。生物神经网络系统不需要知道它在寻找什么,可以分别建模每个个体,并随着数据的变化不断学习。
综上所述,以下是三种不同方法的特点:
五、总结
我们回到开始这篇文章的术语问题。我们的感觉是,“人工智能”这个词在很多方面都被使用了,这让人很困惑。人们使用人工智能来引用上述三种方法,加上其他方法,因此变得几乎毫无意义。“机器学习”这个术语对于从数据中学习的机器来说是一个更狭义的术语,包括简单的神经模型,如ANNs和Deep learning。我们使用“机器智能”一词来指代那些学习但与生物神经网络方法一致的机器。尽管我们仍有很多工作要做,但我们相信,生物神经网络方法是最快最直接的通往真正智能机器的途径。