第一章绪论学习记录（人工智能导论）

“我们必須知道，我们必将知道” ——大卫 $\bullet$ 希尔伯特(David Hilbert)

对人类智能的模拟可通过以符号主义为核心的推理逻辑、问题求解为核心的探寻搜索、以数据驱动为核心的机器学习、以行为主义为核心的强化学习、以博弈对抗为核心的群体智能（两人及以上）等方法实现
符号主义将概念符号化，从判断（前提）出发得到新判断（结论）；问题求解探寻搜索依据已有信息来寻找满足约束条件的待求解答案；数据驱动的机器学习方法从数据出发，从大量数据中发现其所承载语义的内在模式，并利用学习到的内在模式完成识别或分类任务；行为主义为核心的强化学习依据环境所提供奖罚反馈机制学习所处环境可采取的最佳行为模式，在搜索（未知空间）和利用（已有经验）之间寻找平衡，从而形成了自我学习的能力；博弈对抗推动了机器学习从数据最优化拟合到均衡解的求取
图灵机以机械方式进行“计算”，成为了现代计算机的理论模型，标志着自动化计算时代的到来，同时成为了人工智能的“机器载体”
当前人工智能的研究还被限制在“领域人工智能(domain-specific AI)或弱人工智能(narrow AI)”，无法通过自身思考达到更高层次的智能，与具有自我推理、自适应能力特点的通过人工智能(general AI)存在较大差距，智能化机器无法完全取代人类

起源

1955年8月，《人工智能达特茅斯夏季研究项目提案》("A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence")被提出，首次使用了人工智能这个术语，其提到”希望机器能像人那样认知、思考和学习“，列举了AI研究的七个方面问题：自动计算模拟人脑高级功能、使用通过语言进行计算机编程及模仿推理、神经元相互连接形成概念、对计算复杂性的度量、算法自我提升、算法的抽象、随机性以及创造力等能力

人工智能是以机器为载体所实现的人类智能或生物智能

承载计算之能的器械如何产生 $\rightarrow$ 手工计算转自动计算
如何利用计算之器模拟人类智能 $\rightarrow$ 符号逻辑（推理为核心）、联结主义（统计机器学习方法）和行为学派（环境交互过程中进行策略学习）等

可计算载体：形式化与机械化

自然语言很大程度上难以精确表达数学概念，可通过形式化语言来刻画数学概念，如“任意直角三角形两边的平方和等于斜边的平方” $\forall \Delta \in 直角三角形$ , $x, y, z \in \{直角边;直角边;斜边\} \Rightarrow x^2 + y^2 = z^2$
已有知识 $+$ 推理规则，得出先前未定义的知识 $\Rightarrow$ 形式化系统，其可靠性信赖于以下性质：完备性、一致性、可判断性

哥德尔不完备定理《论数学原理及有关系统中不可判定命题》

任何表达力足够强的形式系统都不可能同时具有一致性arithmetical和完备性，且这个系统本身的一致性不能在系统内被证明
哥德尔不完备定理触及了不可计算这一难题，即有些数学问题是无法求解（不可判定）

原始递归和 $\lambda-calculus(\lambda验算)$ 都无法成为人工智能的“机器载体”

1937年，图灵提出“图灵机模型”，并发表了《论数字计算在决断难题中的应用》一文
图灵机模型是一个抽象的机械式计算装置，在计算过程中用了有限步骤后停机，因此它所执行的任务是可计算的

邱奇－图灵论题（Church-Turing thesis, computability thesis）：凡是可计算的函数都可以用图灵机计算

原始递归函数、 $\lambda演算$ 和图灵机在功能上是等效的，即任何可计算函数都可通过这三种方式完成计算、任何不可计算函数都无法通过这三种方式完成计算

前者通过形式化方法“计算”，后者通过机械化机制进行“计算”，图灵机推动了自动计算时代的到来（人工智能的“机器载体”），成为了现代计算机的理论模型

智能计算方法

符号主义(逻辑推理)、问题求解（探寻搜索）、大数据驱动（机器学习）、行为主义（强化学习）博弈对抗（决策智能）

以符号主义为核心的逻辑推理

推理是进行思维模拟的基本形式之一，即从一个或几个已知判断推出新判断的过程。推理、搜索和约束满足并称人工智能问题求解三大方法。逻辑推理是早期AI的主流学派，称为符号主义AI（symbolic AI）
不再使用自然语言进行描述，以定义符号及符号间关系的方式，建立一套高度概括、抽象、严格化和精确化的符号系统

例如有定义：
$human(x)$ x 为凡人
$immortal(x)$ x 为非凡人
则可建立如下命题：
$human(x) \rightarrow \neg \ \ immortal(x)$
又比如亚里士多德(Aristotle)提出的三段论(syllogism)：
$\forall x(human(x) \rightarrow \lnot \ immortal(x)) \bigwedge \ human(Socrates苏格拉底) \rightarrow \lnot \ immortal(Socrates苏格拉底)$
凡人均不是不朽和苏格拉底是人 推出 苏格拉底不是不朽的

推理一般包括 $\bullet1$ 归纳(inductive)、 $\bullet2$ 演绎(deductive)和 $\bullet3$ 因果(causality)

$\bullet1$ .从特殊到一般，由具体到抽象，由现象到本质
$\bullet2$ .从一般到具体，如所有金属导电，铜为金属，则铜导电
$\bullet3$ .“引起和被起来”关系，即判断事物间存在的原因和结果，通常采用结构因果(SCM,structural causal model) 和因果图(causal diagram)

因果

关联(association)
干预(intervention)
反事实(counterfactual)
$\{\forall \ A \Rightarrow B\}$
$Let \ (\bullet1)\ A = A^` \wedge (\bullet2)\ B = B^`$
$Watch \ \Delta \ between \bullet1 \bullet2$ 搜索是人工智能求解的一种主要技术，根据已有信息来寻找满足约束条件的待求解问题答案，主要包括无信息、有信息和对抗搜索(adversarial search)等
$if \ \exists \ \Delta \ is \ Large \ \Rightarrow "There \ is \ causal \ relation"$

image.png

演绎推理中原命题如成立，则逆否命令也成立，只要前提是对的，推理规则也合理，则得到的结论一定有效

注意因果与相关的区别
公鸡叫与太阳升是相关的，但不具因果，如果公鸡不叫，太搜索是人工智能求解的一种主要技术，根据已有信息来寻找满足约束条件的待求解问题答案，主要包括无信息、有信息和对抗搜索(adversarial search)等阳依旧会升起

有之必然，无之未必不然，是谓充分；
有之未必然，无之必不然，是谓必要；
有之必然，无之必不然，是谓充要

以上内容 $\ \\ \Downarrow$

专家系统(expert system)

－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－

问题求解之探寻搜索
搜索是人工智能求解的一种主要技术，根据已有信息来寻找满足约束条件的待求解问题答案，主要包括无信息、有信息和对抗搜索(adversarial search)等

无信息『广度优先和深度优先』
有信息『启发式搜索，在搜索过程中利用与所求解相关的辅助信息，代表算法如贪婪最佳优先搜索和A搜索等』
对抗搜索『博弈搜索(game search)，在一个竞争环境中相互实现相反利益，一方最大化，一方最小化，如最小最大搜索、Alpha-Beta剪枝搜索和蒙特卡罗树搜索(Monte-Carlo tree search)』
蒙特卡罗树搜索通过采样机制来选择合理结果而非穷举所有结果来实现搜索

数据驱动为中心的机器学习方法

与逻辑推理不同，数据驱动(data-driven)从数据出发，利用承载表达某一概念的数据直接寻找并学习该概念所涉及的模式，基于习得的范式对未知数据进行分类或识别。

逻辑推理 $\rightarrow$ 知识到知识
数据驱动 $\rightarrow$ 数据到知识
主要包括：
监督学习、无监督学习和半监督学习等

监督学习

收集n个标数据作为训练数据集，数据集中的标注数据及其标注信息记为 $(X, Y) = \{(x_i, y_i), i = 1, ..., n\}$ ，其中第 $i$ 个样本数据或其特征表达记为 $x_i$ ， $y_i$ 为 $x_i$ 所对应的类别标注信息。
$x_i$ 为训练数据集合, $y_i$ 为label标签数据集合，为了得到语义信息的模式，监督学习基于训练数据集，从假设空间这一学习范围中学习到一个最优化的映射函数 $f(决策函数)$ ，它将数据映射到语义标注空间，实现数据的分类和识别
函数 $f$ 对 $x_i$ 的映射结果称为 $f(x_i)$ ，一个较好的监督学习算法使得 $f(x_i)$ 与 $y_i$ 之间的差距最小，称该机器学习模型学会了如何将 $x_i$ 映射为其所表达的高层语义，之后可以利用训练得到的映射函数对未知数据进行识别或分类

其他方法如可通过概率模型来进行分类和识别

判别式学习方法，从训练数据中学习条件概率分布 $P(y_i|x_i)$ ，并判断 $x_i$ 属于 $y_i$ 的概率，以实现对 $x_i$ 的分类和识别
生成式学习方法，学习数据和类别标签的联合分布 $P$ ，通过贝叶斯理论求取后验概率，完成分类和识别

赫布理论(Hebbian Theory)指出“神经元之间持续重复经验刺激可导致突触传递效能增加(Neurons that fire together, wire together)”，认为神经元之间突触的强弱变化是学习与记忆的生理学基础，为联结主义人工智能研究提供了认知神经心理学基础，其代表如近年来效果显著的深度学习。深度学习区别于其他监督学习算法的主要特征是它没有手工构造特征阶段，通过逐层抽象的“端到端”机制来学习数据内部的隐藏范式，得到更强表达和泛化能力的特征，然后将它应用于分类和识别任务

无监督学习

本身不包含标注信息

半监督学习

部分标注，部分不标注

监督学习包括回归分析、提升算法（boosting)、支持向量机和决策树等判别式学习方法，以及隐狄利克雷分布和隐马尔可夫链等
无监督包括聚类、降维（主成分分析）和期望极大(EM, Expectation Maximization)

行为主义为核心的强化学习

实现完全自主的智能体，其与所处环境交互，依据环境奖惩机制来学习所处状态可施加的最佳行动

“尝试试错”， “平衡未知空间与已有经验”，不断进步，改进行动策略

强化学习（Reinforcement Learning RL）就是这样一种赋予智能体自主监督学习能力，能与环境交互，做出序列决策，完成序列化形式的任务的学习模型

学会学习(Learning to learn)

是一种针对序列优化的学习方法，其与马尔可夫决定过程(markov decision process MDP)有关，刻画了当前状态采取某一行动后如何进入后续状态，以及采取这一行动后从环境获得奖惩反馈的机制
Q学习，用来学习智能体的 $q$ 函数,它记录了某个状态下采取某一动作所能收到的奖惩值

一个较好的可行思路『将 $q$ 函数参数化，用神经网络来拟合 $q$ 函数，从而形成深度强化学习(Deep Reinforcement Learning RDL)』

监督、无监督和强化学习的差异

image.png

博弈对抗为核心的决策智能
博弈论（Game Theory）是经学学的一个分支，博弈行为是多个带有相互竞争性质的主体为达到各自目标和利益，所采取的对抗性质的行为，即“两害相权取其轻，两利相权取其重”

《博弈论与经济行为》
“非合作博弈”，纳什均衡思想

现代博弈研究博弈行为中最优对抗策略及其稳定局势，协助对弈者在一定规则范围内寻求最合理行为方式，机器学习结合博弈对抗方法，使得它从“寻找最优拟合度，求取最优解”向“求取均衡解”转变

实际问题

将多种机器学习算法进行融合使用。举例： $Deepmind$ 研制的 $AlphaGo$ 通过深度学习构造黑白相间棋盘的特征表达，强化学习来进行自我博弈以提升智能体学习能力，蒙特卡罗搜索来找寻最佳落子

类脑计算

通过仿真、模拟和借鉴大脑生理结构和信息处理过程，在结构层次模拟大脑，在器件层次逼近大脑

What I cannot create, I do not understand
不可造者，未能知也
—— 里查德 $\bullet$ 费曼(Richard Feynman)

最后编辑于：2021.03.05 21:24:05

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,839评论 6赞 482
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,543评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 153,116评论 0赞 344
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,371评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,384评论 5赞 374
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,111评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,416评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,053评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,558评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,007评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,117评论 1赞 334
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,756评论 4赞 324
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,324评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,315评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,539评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,578评论 2赞 355
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,877评论 2赞 345

第一章 绪论学习记录（人工智能导论）

起源