本文总结了非合作博弈论的一小部分内容,主要分为核心概念、概念间的关系、经典案例三部分,其中第一、三部分只是罗列概念和案例名称,不会对内容进行阐述,第二部分才是文章核心。文章中的所有概念及案例均来自Steven Tadelis的著作《Game Theory: An Introduction》.
核心概念:
第一章
静态博弈的两步(static game)
完全信息的含义(complete information)
公共知识的意思(common knowledge)
规范式博弈的3个要素以及矩阵表示(Normal-form game)
帕累托占优与帕累托最优(Pareto dominated& Pareto optimal)
第二章
严格被占优策略(strictly dominated strategy)
严格优势策略均衡(strictly dominant equilibrium)
IESDS方法(迭代删除严格被占优策略Iterated elimination of strictly dominated strategy)
最优应对(Best respons)
信念(Belief)
最优应对对应(best response correspondence)
可理性化策略(rationalizable strategy)
第三章
纳什均衡(带信念的定义和不带信念的定义)
矩阵中如何找纳什均衡
第四章
扩展式博弈的要素(extensive-form game)
扩展式博弈的博弈树表示(game tree)
信息集(information set)
完美信息与完美信息博弈(perfect information)
扩展式博弈的纯策略(pure strategies in extensive-form games)
扩展式博弈的规范式表示(Normal-form representation of extensive-form games) 以及该表示下如何找Nash均衡
第五章
序贯理性(sequentially rational)
逆向归纳(backward induction)
适当的子博弈(proper subgame)
子博弈纳什均衡(subgame-perfect Nash equilibrium)
第六章
不完全信息(incomplete information)的三个组成部分
不完全信息下的静态贝叶斯博弈(static Bayesian game of incomplete information)
贝叶斯博弈的纯策略(pure strategy)与混合策略(mixed strategy) (考虑到自己不同类型上的行为)
纯策略的贝叶斯纳什均衡(pure-strategy Basyesian Nash equilibrium)
阈值法则(threshold rule)
概念关系:
我理解博弈论就是对不同博弈进行分类、表示和对解的研究的学科。
分类
根据参与者是同时行动还是有先后顺序,分成静态博弈和动态博弈;例如两个人玩石头剪刀布就属于静态博弈,因为两个人是同时出拳(自己的行动)的;而棋牌类游戏基本上都是动态博弈。
根据博弈中参与者的行为、结果和收益函数是否是共同知识,分为完全信息博弈和非完全信息博弈;由于这两个方面是独立的,因此就有完全信息的静态博弈(前三章)、完全信息的动态/扩展式博弈(第四、五章)、不完全信息的静态博弈(第六章)。(暂不考虑不完全信息的动态/扩展式博弈)
其中,动态博弈还存在完美信息与非完美信息的区别,这主要取决于后做决策的参与者能否知道前面做决策的参与者做的决策(用严格的话说就是信息集是否都是单点集)
完全信息 | 不完全信息 | |
---|---|---|
静态博弈 | 完全信息下的静态博弈 | 不完全信息下的静态博弈 |
动态博弈 | 完全信息下的动态博弈 | 不完全信息下的动态博弈 |
表示
主要学了规范式表示(对于二人博弈来说就是矩阵表示)和扩展式表示(博弈树表示)。对于完全信息的静态博弈,明显更适合规范式表示;对于完全信息的扩展式博弈,明显更适合扩展式表示,但是也可以用规范式表示。
还有一个至关重要的定义,就是在不同类型博弈下,对博弈策略的定义。我们只讨论纯策略。在完全信息静态博弈下,一个纯策略是一个确定的行动;在完全信息的扩展式博弈下,参与者的一个纯策略是一个映射,从他的信息集映射到行为集上,通俗地说,参与者的一个纯策略是在博弈前就确定好他在所有信息集上采取的行为;在静态的贝叶斯博弈中,参与者的一个纯策略也是一个映射,从他的类型集映射到行为集上,通俗地说,在参与者知晓自己的类型前,在所有可能的类型上选择采取的行为。
求解
同样的一种博弈类型,可以有不同的定义解的方法,我们从存在性(existence)、唯一性(uniqueness)及不变性(invariance)来评价不同解。
完全信息的静态博弈,可以用IESDS方法,也可以找纳什均衡。IESDS方法求得的解更强,但是博弈不一定有唯一的IESDS解。此外还可以求严格优势策略均衡和可理性化策略均衡。
完全信息的扩展式博弈,可以用规范式表达找到纳什均衡,但这些纳什均衡有的不合理,这时候就要引入序贯理性的概念,并且用逆向归纳法求出所有更加合理的纳什均衡;对于非完美信息下的完全信息的扩展式博弈,就不适合使用逆向归纳法,但是要是还想让它满足序贯理性,我们就引入了适当的/真子博弈(proper subgame),并求得子博弈完美纳什均衡
对于不完全信息下的静态博弈/贝叶斯博弈,我们定义了它的纳什均衡,也就是纯策略的贝叶斯纳什均衡
完全信息下的静态博弈 | 完全信息下的动态博弈 | 不完全信息下的静态博弈 |
---|---|---|
严格优势策略均衡 | 纯策略纳什均衡 | 纯策略贝叶斯纳什均衡 |
IESDS策略均衡 | 序贯理性策略均衡 | |
可理性化策略均衡 | 子博弈完美纳什均衡 | |
纯策略纳什均衡 |
经典案例:
第一章
囚徒困境(prisoners' dilemma)
投票表决(voting on new agenda)
石头剪刀布(Rock-paper-scissors)
性别之战(battle of the sexes)
第二章
广告博弈(advertising game)
选美比赛(p-beauty contest)
第三章
胆小鬼博弈(game of chickens)
猎鹿博弈(stag hunt game)
公共品悲剧(tragedy of the commons)
选举竞争(electoral competition)
第四章
有顺序的性别之战(sequential-move battle of the sexes)
第五章
自愿的性别之战(the voluntary battle of the sexes)
卡片博弈(a game of cards)
蜈蚣博弈(centipede game)
斯塔克伯格博弈(Stackelberg Competition)
第六章
不完全信息下的进入博弈(incomplete-information entry game)
不完全信息下的胆小鬼博弈(game of chicken)