作者:北冥乘海生(清华大学信息与通信工程博士/《计算广告》作者)
原文链接:机器学习、优化理论、统计分析、数据挖掘、神经网络、人工智能、模式识别之间的关系是什么? - 北冥乘海生的回答 - 知乎
简单来说,这几个概念的关系如上图所示。
从机器学习的核心视角来看,优化(optimization)和统计(statistics)是其最最重要得两项支撑技术。当然,在人工智能领域“专家遍地走、大师多如狗”的今天,大家都醉心于“二十一天精通人工智能”这样的目标,并没有多少人讨论这些基础技术的重要性。不过,负责任地说,要想成为机器学习领域真正的专家,对这两项基础从原理到实践的深入掌握,是必不可少的。
至于神经网络,或者以此为基础的深度学习,是机器学习的一个分支方法。这个分支的重要程度如此之高,以至于大家可能把它当成了机器学习的同义词。不过,在数据量不那么充分的领域,非深度学习的模型和方法还是有许多应用场景。总之,这两者的逻辑关系肯定是包含的关系。
人工智能、模式识别和数据挖掘,这三个是应用层面的概念,他们的概念互有交叠,产生背景和发展历史有所不同,但使用的工具又是相通的:人工智能是六十年前达特茅斯会议提出的问题,最初的目标在于让机器解决听、看、理解、思考等人类智能行为问题。人工智能的假想敌——人类,恰恰由于多年的进化,在这些问题上能力非常强,所以人工智能从诞生那一天起就面临着巨大的挑战,三起三落才有所突破。
数据挖掘更多地是解决生产、金融、互联网等领域高维数据的缄默与规律发现,在最近几年人工智能概念的外延被大大拓展以后,这些面向高维数据的问题也被称为“超人工智能”问题。另外一个不同点,人工智能往往倾向于机器决策的“自动化(Automation)”方法论,而数据挖掘最初倾向于辅助人类决策的“洞察(insight)”方法论。不过今天来看,只有机器自动决策才是王道。
模式识别是早年间自动化领域提出的一个应用概念,相当于机器学习中的分类、聚类等概念的具体应用,由于场景适用面较窄,目前多为人工智能这个更宽泛的概念所替代了。
拓展阅读:
机器学习、优化理论、统计分析、数据挖掘、神经网络、人工智能、模式识别之间的关系是什么? - 留德华叫兽的回答 - 知乎