关于囚徒困境的思考。博弈论是大学曾经学过的学科,例如零和博弈,智猪博弈,囚徒困境等等。我们平时玩的游戏,大多数是零和博弈,我的胜利需要以对手的失败为代价,你多拿一些我就少拿一些,因为总数的固定的。这种情况常见于同一行业内的竞争,抢占市场占有率,吞并一个竞争对手,就少一个。可实际上这种情况还是少数,囚徒困境在日常生活中更为常见。
囚徒困境的模型很简单,有两个对策者,他们都可以有两个选择,合作或背叛。每个人都在对方不知情的情况下做出选择。不论对方选择什么,选择背叛总能比选择合作有较高的收益。而所谓困境是指,如果双方都选择背叛,其结果比双方合作要糟糕。简单用钱来解释收益,如果A选择合作而B选择背叛,那么B得5元,即背叛的诱惑为5元,A得0元,即给笨蛋的报酬;如果A选择合作而B选择合作,那双方都得3元,即对双方合作的奖励;如果A和B都选择背叛,那么双方都得到1元,即对双方背叛的惩罚。这个困境在于,假设对方选择合作,那我背叛可以得5元而合作只能得3元;假设对方背叛,那我合作只能得0元,而背叛可以得1元。好像最聪明的做法就是选择背叛。如果游戏只进行一场,其实并没有讨论的必要,直接背叛就好了。
而当游戏的次数逐渐增加,甚至引入极限的概念,把有限游戏(即零和博弈,以一方胜利一方失败为结束)变为无限游戏(通过彼此探索和拓展游戏边界而使游戏无限的进行下去),那么就会产生游戏策略问题。
如果这场游戏的场次增多,始终选择背叛肯定不是最佳的策略,因为双方在背叛的情况下所得收益仅为都合作时候的三分之一。如果可以站在上帝视角,我们可以简单推算最优方案,即如果双方始终合作进行10场,那么双方所得分别为30元。如果一方合作一方背叛,然后一方背叛一方合作,循环5个周期,那么10场游戏,每人得25元。也就是说当【合作的奖励>(背叛的诱惑+笨蛋的报酬)/2】,那么双方选择合作为最佳策略。而当【合作的奖励<(背叛的诱惑+笨蛋的报酬)/2】那么轮流背叛为最佳策略。实际上,游戏的双方不可能拥有上帝视角,所以无法做出上述推断。
事实上,我们在此基础上再增加一些个体,即游戏不只是双方进行,而变为多方进行,为了便于思考,仍然取极限把多方直接拓展为无数方。
到目前为止,这场博弈已经可以与实际生活产生联系了。实际上,我们每一个人作为一个个体,在我们漫长的一生中会遇到无数的人,也许这个数量根据我们生命的长度以及活动范围的局限是有上限的,只不过上限比较大,思维上可以设想为无穷。
我们遇到的每一个人都可以当做博弈的双方,只不过这场游戏的目的不是胜过对方,因为在漫长的一生之中,胜过一个人对整个人生的发展起不到任何作用。我们站在这个角度上思考,如何制定策略才能实现我们人生的最大收益?