有个游戏,叫做“囚徒困境”
游戏中有两个人,手上分别有两张牌,分别是“合作”牌和“背叛”牌;游戏规则是这样:
双方都打出“合作”牌,则双方都收入300块;
双方都打出“背叛”牌,则双方都罚款10块;
当一方打出“合作”牌,另一方打出“背叛”牌时,“合作”牌的人将罚款100元,“背叛”牌的人将收入500元;
为什么叫“囚徒困境”呢?理论上,只要双方都合作,都可以获得300元,双人的利益是最大化,可是问题是,双方其实是独立个体,也无法沟通,而且即使能沟通,你怎么知道对方会不会骗你。
所以如果对方打出“合作”牌,我为了自己最好的收益应该打出“背叛”牌;如果对方打出“背叛”牌,我减少自己损失也是打出“背叛”牌;也就是说,在这样的博弈之中,最后可能双方会打出“背叛”而面对双输的局面,这就是“囚徒困境”。
有没办法可以跳出这个“囚徒困境”?
在面对一局定胜负的局面,我们可能很难做到。但是我们人生在面对困境不会只有一局的。当你和你发小的博弈,当你和你同学的博弈,当你和伴侣的博弈,我们总会遇到很多次这种应该选择“合作”还是“背叛”的时候,甚至最早我们的祖先就早已面对“合作”还是“背叛”的选择题了。
在面对多局重复的情况,我们则会面对不同的策略;罗伯特·阿克塞尔罗德在《合作的进化》就进行了这个探讨,他利用计算机程序,输入了不同的策略算法:有的策略是每一局都选合作,有的策略是每一局都选背叛;
但有的策略是复杂点,比如我第一次选合作,但是只要遇到对方选一次背叛,我之后会“强烈报复”对他都选背叛;比如我第一次选合作,但是我下局我的选择是“以牙还牙”的和对方上局的出牌一致;还有就是,只要是我背叛而对方是合作的一局,那我下一局就会“内疚”而打出合作;
阿克塞尔罗德进行了两次比赛,把不同的共六十多个策略两两碰对,利用计算机筛选出哪个策略最高分,结果两次都是叫“以牙坏牙”的策略是最高分,也就是我们前面所说的,如果你上局合作,那我下局也会合作,而如果你上局背叛,我下局将会背叛。
这不就和我们现实生活中流行着“有恩必报,有仇报仇”的现象很一致吗?
有人把“合作为主”看为“善”,把“背叛为主”看做“恶”
如果这些善恶的策略进入生存的机制又会怎样呢?于是阿克塞尔罗德把这些策略进行了第三次比赛,而这次比赛不是得分比赛而是“生存”的比赛,而获胜的奖品是自我的复制品。在经历了1000代之后,这些策略的种类和数量慢慢稳定下来,一些“骗子”,“傻瓜”的策略慢慢的的灭绝,活下来的策略,都是“善”的策略为主。
由此我们可以看到:
世界还是会向“善”
善有善报恶有恶报,是人世间的“理”,也是我们人类文化博弈流传下来的“优秀”策略
纯“善”(也就是只会选合作)并不是优秀的策略
不过以上的竞争是基于策略种类丰富而且均衡,各自初始条件平均的基础条件下进行的,而事实上,世界是复杂的。
比如上诉每次都获胜的“以牙还牙”策略,如果遇到周围都是“纯恶”策略(每次背叛)为主的环境,那么“以牙还牙”策略很难获得优势,他第一局就输惨了(以牙还牙的第一局都是选合作),只是后面可以势均力敌。
而被称为“傻子”的“纯善”策略(只会选合作),在“恶”环境为主当然是必死无疑,但是如果在搭上“以牙还牙”这种生存率极高的策略的顺风车,在那1000代之后以“善”为主的策略,这种傻子纯善是能活得很好,这也是“阿甘”我这个时代能被歌颂的原因,但是如果早期的人类社会,可能就没那么好过了。
所以“环境基础”对一个策略的生存也是极为重要,家长为孩子挑选一个良好的环境也是很重要。
当然,人类不会单纯到只有非“善”即“恶”的策略,人性是复杂的,也许会因为环境不同而激发出不同的策略,也许“善”为主的人类只是把“恶”放在隐秘的角落。
但不管怎样,人类至少是总体“向善”,这是人类长久以来,也许在“智人”时代就已经开始博弈而流传下来的优秀文化,所以我们宣扬“爱”,宣扬“善”,惩罚“恶”,依然需要坚持。