昨天认识了博弈论是什么,今天开始讲书中说到的博弈论和机遇的关系。
生活中常见的一类博弈论问题就是资源的获取和分配,这是那场数学讲座讲的东西。其中提到了本书中讲到的一个定理:“极小极大定理”——对于每个两人零和博弈,每个局中人都存在一个混合策略使得当局中人使用这些策略时,双方有相同的支付期望。而且,这个期望值也是每个局中人能指望从博弈的一局中得到的最优支付。因此,这些混合策略是两个局中人所用的最优策略。(选自课件)
这里介绍一个概念:零和博弈。指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作的可能。(来自百度),说起来很好理解,零和,就是说竞争后双方的收益亏损和为零,不是你死就是我活,两者之间不存在共赢。
极小极大定理告诉我们,在一个零和博弈中,对双方来说都是最优解的策略一定存在,而且在这时候两者的收益是相等的。说起来也很简单,我这里借用一个分蛋糕的博弈论经典例子。
假设有两个小盆友分蛋糕,一个孩子先分蛋糕,然后让来外一个孩子去先选蛋糕(不考虑情感因素)。记切蛋糕的孩子为A,选蛋糕的孩子为B,用“A得到的蛋糕大小,B得到的蛋糕大小”表示分蛋糕的结果。
用极小极大定理来分析。对A来说,“极小”指他得到的最少,也就是B拿走了大的一块蛋糕。“极大”是指A让自己拿到大块蛋糕,由于A知道B肯定会拿走较大的一块,那么为了减少损失A会在分蛋糕的时候吧较小的一块切得大一点,那么这么一来对A来说最好的结果就是左上角的结果:两块切得一样大。此时就是极小极大定理中所说的A的极小值和极大值相等了,这就是本次博弈的最优理性解。
那次讲座中并没有讲这种混合策略是是么样的,但是在那次讲座中,教授和一个学生玩了几局猜拳游戏。然后教授问,你刚刚第一把赢了我,请问你是用了什么策略?同学说了一堆,然后教授又说,后面两把我都赢了你,你猜我是用了什么策略?我用的策略就是没有策略!纯随机出拳!接下来他就讲到在一次决策中随机决定有可能会有最好的结果。
书中在将这个定理用到了一个“支付表”模型,还涉及到数学期望的理解。。。比较麻烦。。。我这里就不说了。。。
但是这么看下来,作者好像没有告诉我随机选择为什么是重要的。我在翻看课件的时候,里面有提及一点,在决策双方都完全依靠概率计算来的等概率结果进行选择的时候,双方收益情况的数学期望为0,也就是达到了相等,双方都没有收益。
呃。。。这节讲的有点混乱。。。因为我也木有理解的很透彻。。。不过就先讲这么多。。。先暂时理解到:有时候决策的时候按照“概率决策”的随机行为可能有更好的结果。。。尽管不知道这是怎么来的。。。
明天补充这一节的一些其他知识,有关博弈采取概率决策时双方策略保护的重要性。。。也是个奇怪的难理解的东西。。。我大概只会讲讲例子。。。OTZ