如何与对手斗智斗勇?
在与对手博弈的过程中,我们与对手之间的对策自然会相互影响,面临这种更加复杂的情况,我们需要做两件事情,第一是防止对手预测我们的策略,第二是要采取措施从而影响对手顺从于我们的策略。
首先说怎样防止对手预测我们。最有效的一招就是采取随机策略,使对手难以预测我们的行为,此时正是无招胜有招。在体育比赛中的运动员经常采取随机策略,比如在网球比赛中,比如,甲运动员正手打球和反手打球一样熟练,那么他的对手乙运动员的防守就会更加困难,因为每一次都要考虑甲运动员是会正手打球还是反手打球。
我们也经常会看到在战争中采用随机策略的好处,比如二战期间,盟军计划在欧洲开辟第二战场,当时有两个地方可以登陆,一个是诺曼底,一个是加来港。诺曼底海滩相对平坦,加来港地形易守难攻,对于盟军指挥官来说,优势策略当然是聚集所有兵力登陆诺曼底。但是盟军想要在诺曼底登陆这事,德军也很容易想到,所以德军的优势策略就是,重兵驻守诺曼底,分兵驻守加来港。
于是,盟军就使用了随机策略,彻底把德军给弄糊涂了。首先,盟军假装进攻加来;然后,盟军策反了一个德军间谍,还把间谍叛变的消息透露给德军,并且让这个间谍给德军发了一条特别容易破解的加密信息,内容是盟军将在诺曼底登陆;第三招,从医院借了具死尸,给死尸编了一个盟军上校军官的身世,并给死尸包里装上诺曼底登陆作战计划的小本子,扔到德军控制区域的海滩上,然后登报说上校失踪了。
这个时候,德军指挥部分析:首先,盟军都在加来附近囤积兵力了,很可能是要进攻加来了;第二,咱们的间谍叛变了,而且发过来的信息特别容易破解,所以这话得反着理解,诺曼底登陆大概率是假的;这时又突然冒出来一个上校的死尸,包里的诺曼底作战计划不知是真是假。
最后的结局大家都知道了,德军最终选择重兵驻守加来港,盟军以优势兵力成功登陆诺曼底。
这就是防止对手预测我们的方法,那我们又该怎么去影响对手呢?我们可以学习两个方法,一个是无条件行动,另一个是通过威胁或者许诺造成的有条件行动。
首先是无条件行动,也就是无论对手采取什么措施,我们都会按照计划做一件事情。比如斯大林在对抗纳粹的入侵时就采取了这一策略,他说:“我们必须组织一场毫不留情的战斗。绝不能让敌人拿到一片面包或一升汽油。合作农场的农民必须将牲口赶到别处,将粮食转移到其他地方。无法转移的东西一律就地毁灭。桥梁和道路必须埋设地雷。森林和仓库都要烧毁。留给敌人的只能是难以忍受的局面。”
不过,这一策略有时也会失灵。比如,上个世纪传媒大亨默多克想要收购《纽约》杂志,而《纽约》杂志的负责人并不想被收购,因此该杂志的许多专栏作者明确表示如果《纽约》杂志被默多克收购,他们就会离开这个杂志。最后的结果是默多克仍然收购了《纽约》杂志,那些专栏作者确实离开了。这是为什么?因为默多克想要的并不是这些作者,而是广告客户。要实施这一策略最重要的一点是找准对手到底需要什么。
我们看到这些无条件行动无论是否成功,自己必然会受到一定的伤害。斯大林坚壁清野的做法确实给纳粹的补给造成了巨大的问题,但苏联也损失惨重,付出了很大的代价。专栏作者虽然牺牲了自己的工作却仍然没能挽回杂志被收购的命运。所以我们应该尽可能避免这种做法,减少破坏性的巨大浪费。我们需要寻找别的方式,那就是通过威胁或者许诺造成的有条件行动。威胁说的是对不肯跟你合作的人进行惩罚。比如,你想让你的孩子吃掉他并不喜欢的菠菜,那就可以说:“如果你不能吃完菠菜,就不能出去玩。”而许诺是给愿意跟你合作的人提供回报。比如,你想让部门员工努力工作,那你可以说:“大家辛苦辛苦,等这个项目忙完了,给大家好好放个假”。
这个方法也不难理解,即便是在国际竞争的场合也能用得上,比如1962年的古巴导弹危机,在当年10月,苏联开始在古巴装备核导弹。约翰·F·肯尼迪总统在他的政府内部进行了10天的紧张讨论之后,宣布要对古巴实施海上封锁。假如苏联当时接受这一挑战,此次危机很有可能升级为超级大国之间一场倾巢而出的核战争。不过,经过几天的公开表态和秘密谈判,赫鲁晓夫最后还是决定避免正面冲突。
肯尼迪总统在这次危机中使用了边缘政策也就是将你的对手带到灾难的边缘,迫使他撤退。边缘政策实际上就是一种威胁,通过创造一个擦枪走火的风险,使得对手被迫按照自己的意愿行事。如果肯尼迪总统一开始就威胁赫鲁晓夫拆除古巴的导弹,否则爆发核战争,其实这个威胁很难实现,因为危险实在太大了。这个政策的精妙之处就在于这个风险,虽然表明战争必然爆发的确定性的威胁并不能让人信服,但表明战争可能爆发的风险或概率却可以变得可信。
从这个案例我们可以看出除了需要有一个计划好的行动策略以外,还要使这个承诺变得更加可信。比如我们非常的熟悉的破釜沉舟,在1066年,征服者威廉(William)的侵略大军烧毁了自己的船只,从而立下了一个许战不许退的无条件承诺,士兵已经别无选择,只有战而胜之。这就是通过断绝反悔的路线,使得背弃承诺的能力大大下降。
前边我们讲的大都是怎么在博弈中战胜对方,那么如何在博弈中合作?
我们首先一起了解一个经典的博弈论模型——囚徒困境。警察抓住了甲乙两个合伙犯罪的嫌疑犯,虽然知道两人有罪,但证据不足。于是警察将分别他们关在两个不同的牢房,并告诉他们:如果两人都抵赖,各判刑1年;如果两人都坦白,各判8年;如果两人中一个坦白而另一个抵赖,坦白的因立功放出去,抵赖的判10年。于是,两个囚徒都面临两种选择:坦白或抵赖。
现在设想一下甲囚徒的思路。甲知道乙要么招供,要么拒不认罪。假如乙招供,自己若是拒不认罪或招供,与之对应,他会被判处10年或8年徒刑,当然是对他来说招供的下场显然略胜一筹。假如乙拒不认罪,自己若是同样拒不认罪或招供,与之对应,他会被判处1年或者被释放,相比之下,对他来说招供的下场仍然略胜一筹。因此,甲的最佳做法就是招供。
而在另一间牢房的乙也是这样想的,于是得出了同样的结论。最后的结果就是两个人同时招供,各判刑8年。
囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性。那么该如何走出囚徒困境,使博弈双方可以为了共同利益而去合作?
其实在生活中有很多关于合作的博弈,比如石油输出国组织——欧佩克,这是为了协调成员国石油政策而成立的组织。如果没有这个组织,每一个石油生产国都想通过扩大石油生产量,来提升自己国家的收入,但因为市场的需求是一定的,扩大石油生产量就会降低石油价格,结果就会使各个石油生产国的利益都受到损失,当然,消费者可以从中受益。
为了避免这样的囚徒困境,就建立了欧佩克这样的一个组织进行协调,从而确保整体利益的最大化。这个时候一个新的问题就会出现,每一个石油生产国都有作弊的动机,也就是背地里多生产石油。那又该如何觉察这么一种作弊行为?什么样的惩罚才能阻止这种行为?
在这个例子中觉察有人作弊有一个非常明显的指标就是石油的价格,如果石油的价格下降就有可能是有人在作弊,除此之外,导致石油价格下降另一个主要原因就是市场对石油的需求减少了。这两个原因很难区分,于是欧佩克组织设置了一个“触发”价格,一旦石油价格低于“触发”价格,就认定有人作弊,随即采取惩罚措施。
接下来,我们就来讨论如何减少作弊行为,主要有两个因素能够影响作弊者的行动:成本和收益、博弈的次数。
我们先来看博弈各方的成本和收益。如果我们修改一下囚徒困境里成本和收益就会看到不同的情况。比如,被审讯的是一对关系非常好的朋友,宁可一起坐牢,也不愿意背叛对方。或者,被审讯的两个人都是黑帮成员,如果其中一个人坦白之后被释放出来,就会遭遇黑帮的追杀,背叛的成本非常大,所以在影视剧中会看到警察有时会威胁囚犯将其释放。
第二个因素是博弈的次数。假如博弈的次数是有限的,那么我们运用上文提到的向前展望、倒后推理原则,不难发现,一旦再也没有时间可以进行惩罚,合作就会告终,也就是说最后一次合作一定会有人作弊。如果被审讯的这两个人谁也不认识谁,对方要坐几年牢跟自己没关系,那互相背叛的概率就很高;如果他们是熟人,以后还会再见,还有合作的可能,那背叛对方的概率就会很低。博弈终究会有终点这个事实无法改变,但是这个终点的时间是可以改变的,因此最好的方式就是不去确定终点的时间。
美国密歇根大学的政治学学者罗伯特·阿克塞尔罗德做了一个实验给我们提供了一个在博弈中合作的最佳策略。爱克斯罗德组织了一场计算机模拟竞赛。这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演着“囚徒困境”案例中的一个囚徒的角色。他们把自己的策略编入计算机程序,进行捉对博弈。他们每个人都要在合作与背叛之间做出选择,并以单循环赛的方式玩200次,从而逼真地反映出只有长期性的人际关系。而且,这种重复的游戏允许囚徒在做出合作或背叛的抉择时,参考对手程序前几次的选择。最终这次竞赛的冠军使用的是一种被叫做“以牙还牙”的策略:第一,不主动背叛别人;第二,以牙还牙;第三,如果你背叛我之后,又回心转意,又愿意合作,那我不计前嫌,继续跟你合作。这个策略在最开始会吃亏,但是只要有一小部分人一直坚持这个策略,就能生存下来,还能吸引越来越多的人加入他们。如此简单的程序之所以反复获胜,是因为它实行了以其人之道还治其人之身的原则,并且用如下特质使它能够最有效地鼓励其他程序同它长期合作:善良、可激怒、宽容、简单、不妒忌。