“我们必須知道,我们必将知道” ——大卫希尔伯特(David Hilbert)
- 对人类智能的模拟可通过以符号主义为核心的推理逻辑、问题求解为核心的探寻搜索、以数据驱动为核心的机器学习、以行为主义为核心的强化学习、以博弈对抗为核心的群体智能(两人及以上)等方法实现
- 符号主义将概念符号化,从判断(前提)出发得到新判断(结论);问题求解探寻搜索依据已有信息来寻找满足约束条件的待求解答案;数据驱动的机器学习方法从数据出发,从大量数据中发现其所承载语义的内在模式,并利用学习到的内在模式完成识别或分类任务;行为主义为核心的强化学习依据环境所提供奖罚反馈机制学习所处环境可采取的最佳行为模式,在搜索(未知空间)和利用(已有经验)之间寻找平衡,从而形成了自我学习的能力;博弈对抗推动了机器学习从数据最优化拟合到均衡解的求取
- 图灵机以机械方式进行“计算”,成为了现代计算机的理论模型,标志着自动化计算时代的到来,同时成为了人工智能的“机器载体”
- 当前人工智能的研究还被限制在“领域人工智能(domain-specific AI)或弱人工智能(narrow AI)”,无法通过自身思考达到更高层次的智能,与具有自我推理、自适应能力特点的通过人工智能(general AI)存在较大差距,智能化机器无法完全取代人类
起源
1955年8月,《人工智能达特茅斯夏季研究项目提案》("A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence")被提出,首次使用了人工智能这个术语,其提到”希望机器能像人那样认知、思考和学习“,列举了AI研究的七个方面问题:自动计算模拟人脑高级功能、使用通过语言进行计算机编程及模仿推理、神经元相互连接形成概念、对计算复杂性的度量、算法自我提升、算法的抽象、随机性以及创造力等能力
人工智能是以机器为载体所实现的人类智能或生物智能
承载计算之能的器械如何产生 手工计算转自动计算
如何利用计算之器模拟人类智能 符号逻辑(推理为核心)、联结主义(统计机器学习方法)和行为学派(环境交互过程中进行策略学习)等
可计算载体:形式化与机械化
自然语言很大程度上难以精确表达数学概念,可通过形式化语言来刻画数学概念,如“任意直角三角形两边的平方和等于斜边的平方” ,
已有知识 推理规则,得出先前未定义的知识 形式化系统,其可靠性信赖于以下性质:完备性、一致性、可判断性
哥德尔不完备定理 《论数学原理及有关系统中不可判定命题》
任何表达力足够强的形式系统都不可能同时具有一致性arithmetical和完备性,且这个系统本身的一致性不能在系统内被证明
哥德尔不完备定理触及了不可计算这一难题,即有些数学问题是无法求解(不可判定)
原始递归和都无法成为人工智能的“机器载体”
1937年,图灵提出“图灵机模型”,并发表了《论数字计算在决断难题中的应用》一文
图灵机模型是一个抽象的机械式计算装置,在计算过程中用了有限步骤后停机,因此它所执行的任务是可计算的
邱奇-图灵论题(Church-Turing thesis, computability thesis):凡是可计算的函数都可以用图灵机计算
原始递归函数、和图灵机在功能上是等效的,即任何可计算函数都可通过这三种方式完成计算、任何不可计算函数都无法通过这三种方式完成计算
前者通过形式化方法“计算”,后者通过机械化机制进行“计算”,图灵机推动了自动计算时代的到来(人工智能的“机器载体”),成为了现代计算机的理论模型
智能计算方法
符号主义(逻辑推理)、问题求解(探寻搜索)、大数据驱动(机器学习)、行为主义(强化学习)博弈对抗(决策智能)
- 以符号主义为核心的逻辑推理
推理是进行思维模拟的基本形式之一,即从一个或几个已知判断推出新判断的过程。推理、搜索和约束满足并称人工智能问题求解三大方法。逻辑推理是早期AI的主流学派,称为符号主义AI(symbolic AI)
不再使用自然语言进行描述,以定义符号及符号间关系的方式,建立一套高度概括、抽象、严格化和精确化的符号系统
例如有定义:
x 为凡人
x 为 非凡人
则可建立如下命题:
又比如 亚里士多德(Aristotle)提出的三段论(syllogism):
凡人均不是不朽和苏格拉底是人 推出 苏格拉底不是不朽的
推理一般包括归纳(inductive)、演绎(deductive)和因果(causality)
.从特殊到一般,由具体到抽象,由现象到本质
.从一般到具体,如所有金属导电,铜为金属,则铜导电
.“引起和被起来”关系,即判断事物间存在的原因和结果,通常采用结构因果(SCM,structural causal model) 和因果图(causal diagram)
因果
- 关联(association)
- 干预(intervention)
- 反事实(counterfactual)
搜索是人工智能求解的一种主要技术,根据已有信息来寻找满足约束条件的待求解问题答案,主要包括无信息、有信息和对抗搜索(adversarial search)等
演绎推理中原命题如成立,则逆否命令也成立,只要前提是对的,推理规则也合理,则得到的结论一定有效
注意因果与相关的区别
公鸡叫与太阳升是相关的,但不具因果,如果公鸡不叫,太搜索是人工智能求解的一种主要技术,根据已有信息来寻找满足约束条件的待求解问题答案,主要包括无信息、有信息和对抗搜索(adversarial search)等阳依旧会升起
有之必然,无之未必不然,是谓充分;
有之未必然,无之必不然,是谓必要;
有之必然,无之必不然,是谓充要
以上内容
专家系统(expert system)
----------------------------------------
- 问题求解之探寻搜索
搜索是人工智能求解的一种主要技术,根据已有信息来寻找满足约束条件的待求解问题答案,主要包括无信息、有信息和对抗搜索(adversarial search)等
无信息 『广度优先和深度优先』
有信息 『启发式搜索,在搜索过程中利用与所求解相关的辅助信息,代表算法如贪婪最佳优先搜索和A搜索等』
对抗搜索 『博弈搜索(game search),在一个竞争环境中相互实现相反利益,一方最大化,一方最小化,如最小最大搜索、Alpha-Beta剪枝搜索和蒙特卡罗树搜索(Monte-Carlo tree search)』
蒙特卡罗树搜索通过采样机制来选择合理结果而非穷举所有结果来实现搜索
- 数据驱动为中心的机器学习方法
与逻辑推理不同,数据驱动(data-driven)从数据出发,利用承载表达某一概念的数据直接寻找并学习该概念所涉及的模式,基于习得的范式对未知数据进行分类或识别。
逻辑推理 知识到知识
数据驱动 数据到知识
主要包括:
监督学习、无监督学习和半监督学习等
监督学习
收集n个标数据作为训练数据集,数据集中的标注数据及其标注信息记为,其中第个样本数据或其特征表达记为, 为所对应的类别标注信息。
为训练数据集合, 为label标签数据集合, 为了得到语义信息的模式,监督学习基于训练数据集,从假设空间这一学习范围中学习到一个最优化的映射函数,它将数据映射
到语义标注空间,实现数据的分类和识别
函数对的映射结果称为,一个较好的监督学习算法使得与之间的差距最小,称该机器学习模型学会了如何将映射为其所表达的高层语义,之后可以利用训练得到的映射函数对未知数据进行识别或分类
其他方法如可通过概率模型来进行分类和识别
- 判别式学习方法,从训练数据中学习条件概率分布,并判断属于的概率,以实现对的分类和识别
- 生成式学习方法,学习数据和类别标签的联合分布,通过贝叶斯理论求取后验概率,完成分类和识别
赫布理论(Hebbian Theory)指出“神经元之间持续重复经验刺激可导致突触传递效能增加(Neurons that fire together, wire together)”,认为神经元之间突触的强弱变化是学习与记忆的生理学基础,为联结主义人工智能研究提供了认知神经心理学基础,其代表如近年来效果显著的深度学习。深度学习区别于其他监督学习算法的主要特征是它没有手工构造特征阶段,通过逐层抽象的“端到端”机制来学习数据内部的隐藏范式,得到更强表达和泛化能力的特征,然后将它应用于分类和识别任务
无监督学习
本身不包含标注信息
半监督学习
部分标注,部分不标注
监督学习包括回归分析、提升算法(boosting)、支持向量机和决策树等判别式学习方法,以及隐狄利克雷分布和隐马尔可夫链等
无监督包括聚类、降维(主成分分析)和期望极大(EM, Expectation Maximization)
- 行为主义为核心的强化学习
实现完全自主的智能体,其与所处环境交互,依据环境奖惩机制来学习所处状态可施加的最佳行动
“尝试试错”, “平衡未知空间与已有经验”,不断进步,改进行动策略
强化学习(Reinforcement Learning RL)就是这样一种赋予智能体自主监督学习能力,能与环境交互,做出序列决策,完成序列化形式的任务的学习模型
学会学习(Learning to learn)
是一种针对序列优化的学习方法,其与马尔可夫决定过程(markov decision process MDP)有关,刻画了当前状态采取某一行动后如何进入后续状态,以及采取这一行动后从环境获得奖惩反馈的机制
Q学习,用来学习智能体的函数,它记录了某个状态下采取某一动作所能收到的奖惩值
一个较好的可行思路『将函数参数化,用神经网络来拟合函数,从而形成深度强化学习(Deep Reinforcement Learning RDL)』
监督、无监督和强化学习的差异
- 博弈对抗为核心的决策智能
博弈论(Game Theory)是经学学的一个分支,博弈行为是多个带有相互竞争性质的主体为达到各自目标和利益,所采取的对抗性质的行为,即“两害相权取其轻,两利相权取其重”
《博弈论与经济行为》
“非合作博弈”, 纳什均衡思想
现代博弈研究博弈行为中最优对抗策略及其稳定局势,协助对弈者在一定规则范围内寻求最合理行为方式,机器学习结合博弈对抗方法,使得它从“寻找最优拟合度,求取最优解”向“求取均衡解”转变
实际问题
将多种机器学习算法进行融合使用。举例:研制的通过深度学习构造黑白相间棋盘的特征表达,强化学习来进行自我博弈以提升智能体学习能力,蒙特卡罗搜索来找寻最佳落子
类脑计算
通过仿真、模拟和借鉴大脑生理结构和信息处理过程,在结构层次模拟大脑,在器件层次逼近大脑
What I cannot create, I do not understand
不可造者,未能知也
—— 里查德费曼(Richard Feynman)