60贝叶斯法则
在日常生活中,当面临不确定时,我们对某事件发生的可能性有一个判断,然后,会根据新的信息来修正这个判断。
统计学上,修正之前的判断称为“先验概率”。修正后的判断称为“后验概率”。
贝叶斯法则就是人们根据新的信息从先验概率得到后验概率的基本方法。
贝叶斯法则
人:好人(GP),坏人(BP)
事:好事(GT),坏事(BT)
一个人干好事的概率等于他是好人的概率p(GP)乘以好人干好事的概率p(GT|GP),加上他是坏人的概率p(BP)乘以坏人干好事的概率p(GT|BP):
Prob{GT}=p(GT|GP)*p(GP)+p(GT|BP)*p(BP)
假定观测到一个人干了一件好事,那么这个人是好人的后验概率是:Prob{GP|GT}=p(GT|GP)p(GP)/Prob{GT}
假定我们认为这个人是好人的先验概率是1/2,观测到他干了好事之后如何修正他的先验概率依赖于他干的好事好到什么程度:
1、是一件非常好的好事,坏人绝对不可能干,则p(GT|GP)=1/2p(GT|BP)=1/2
2、这是一个非常一般的好事,好人会干,坏人也会干:p(GT|GP)=1p(GT|BP)=1
3、介于上述两种情况之间:好人肯定会干,但坏人可能会干也可能不会干:p(GT|GP)=1/2p(GT|BP)=1/2。
假定我们观测到他干了一件坏事,我们相信,好人绝对不会干坏事,那么可以肯定他绝对不是一个好人。p(GT|GP)=1/2p(GT|BP)=1/2,假定我们原来认为他是个好人,也突然发现他干了一件好事,我们如何看待呢?p(GT|GP)=1p(GT|BP)=1
61精炼贝叶斯纳什均衡
混同均衡,因为两类在位者选择同样的价格,直观地讲,因为x<1/2,如果进入者不能从在位者的价格选择中得到新的信息,她选择不进入。
因此,高成本在位者可以通过选择与低成本在位者相同的价格隐藏自己是高成本的事实,低成本在位者也没有必要批露自己是低成本的事实。
分离均衡,因为不同类型的在位者选择了不同的价格。低成本在位者选择了非单阶段最优价格p=4;高成本在位者选择了单阶段最优垄断价格p=6。
如果低成本在位者选择p=5,无法将自己与高成本在位者分开,进入者将进入,但如果他选择p=4,高成本在位者不会模仿,进入者不进入,因此低成本在位者宁愿放弃3单位的现期利润换取4单位的下期利润。
高成本在位者之所以不选择p=4,是因为成本太高,下阶段的4单位例如不足以弥补现期5单位的损失。不完全信息带来的唯一后果是,低成本在位者损失3单位的利润,这也可以说是他为了证明自己是低成本而支付的“认证”费用。
啤酒-蛋糕博弈,参与人1是一个善于打架的强者的概率是0.9,是一个不善于打架的弱者的概率是0.1,但是,即使参与人1知道自己能打赢,也不想和别人打架。如果参与人1是弱者,参与人2就想和他打架。
参与人2不知道参与人1的类型,但他能够观察参与人1早餐吃什么,如。参与人2知道若者喜欢以蛋糕为早餐,而强者喜欢以啤酒为早餐。
两个均衡:无论参与人1是什么类型,都选择啤酒做早餐,参与人2选择不打架;无论参与人是什么类型,都选择蛋糕作为早餐,参与人2选择不打架。——被排除
62信号传递博弈及其应用举例
信号传递博弈是一种比较简单的但有广泛应用意义的不完全信息动态博弈。
参与人:两个,信号发送者1和信号接收者2;1的类型是私人信息,2的类型是公共信息(即只有一个类型)。
博弈顺序:1、“自然”首先选择参与人1的类型,参与人1知道,但参与人2不知道。只知道1属于该类型x的先验概率。
2、参与人1观测到类型x后发出信号。
3、参与人2观测到参与人1发出的信号,使用贝叶斯法则从先验概率得到后验概率,然后选择行动。
信号传递博弈的所有可能的精练贝叶斯均衡可以划分为3类:
分离均衡:不同类型的发送者(参与人1)以1的概率选择不同的信号,或者说,没有任何类型选择与其他类型相同的信号在分离均衡下,信号准确地揭示出类型。
混同均衡:不同类型的发送者选择相同的信号,或者说,没有任何类型选择与其他类型不同的信号,因此,接收者不修正先验概率。
准分离均衡:一些类型的发送者随机地选择信号,另一些类型的发送者选择特定的信号。
强盗分金——子博弈精练纳什均衡((U,U’),L).U’和L分别是参与人1和参与人2在非均衡路径上的选择。
逆向归纳法求解子博弈精练纳什均衡的过程,实质上是重复剔除劣战略的过程:从最后一个决策结依次剔除每个子博弈的劣战略,最后生存下来的战略构成精练纳什均衡。
贝叶斯纳什均衡:n人不完全信息静态博弈的纯战略均衡是一个类型依存战略组合,其中每个参与人i在给定自己的类型θi和其他参与人类型依存战略的情况下,最大化自己的期望效用。
精练贝叶斯均衡是贝叶斯均衡、子博弈精练均衡和贝叶斯推断的结合。它要求:
1、在每个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);
2、给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;
3、每一个参与人根据贝叶斯法则和均衡战略修正后验概率。