刚好这两天准备自己的presentation用到了博弈论的知识,所以决定刚好“露两手”自己的知识储备——好吧开个玩笑,博弈论本身就可以作为一门专业来研究的,绝非我所能两三篇文章讲清楚的。
写这篇文章我一不会提“博弈”的定义,二不会涉及其历史,三不会谈及它的重要性(百度自己搜)。那是因为“博弈论”最有趣的地方就在于推理与展望,在于可以运用概率提高胜算,在于即学即用的日常事例。而不是使普通人望而却步的复杂公式与超量运算。这就是我所想要介绍给大家的博弈论。
好吧话不多说进入正题:
—个经典案例:
一.一个笑话
《策略思维》第一章 3.直奔牢房
在斯大林时期的苏联,有一位乐队指挥坐火车前往下一个演出地点,正在车上翻看当晚将要指挥演奏的作品的乐谱。两名克格勃军官看见他在读着什么,错把乐谱当成某种密码,立即将他作为间谍逮捕了。他争辩说那只是柴可夫斯基的小提琴协奏曲,却无济于事。在他被投人牢房的第二天,审问者自鸣得意地走进来,说:“我看你最好还是老实招了吧。我们已经抓住你的朋友柴可夫斯基了,他这会儿正向我们招供呢。”
这个笑话成了介绍囚徒困境的开场白,而囚徒困境可能是最广为人知的博弈。现在我们就来看看它如何导出符合逻辑的结果:假设克格勃真的逮捕了某人,而此人的唯一罪名就是取了“柴可夫斯基”这么一个名字,而且克格勃将乐队指挥和他分开进行审问。
如果这两名无辜者否认克格勃指控的罪名,那么,他们将分别被判处3 年徒刑。
如果乐队指挥昧着良心承认罪名,其中还牵涉到那位素不相识的所谓“同谋”,柴可夫斯基却仍然否认罪名,那么,乐队指挥可以在1年之后获得自由(以及克格勃的赞赏之情),而柴可夫斯基则会因拒不认罪而遭到严厉惩罚,被判处25 年徒刑。当然了,假如乐队指挥与柴可夫斯基调换一下,乐队指挥拒不认罪,柴可夫斯基不但屈从认罪,还把他供了出来,那么,两人的下场也会发生相应的变化。
假如两人同时认罪,那么,他们都将被判处这一罪名的标准刑罚——10 年徒刑。
现在设想乐队指挥的思路。他知道柴可夫斯基要么招供,要么拒不认罪。假如柴可夫斯基招供,乐队指挥若是拒不认罪或招供,与之对应,他会被判处25 年或10 年徒刑,相比之下,对他来说招供的下场显然略胜一筹。假如柴可夫斯基拒不认罪,乐队指挥若是同样拒不认罪或招供,与之对应,他会被判处3 年或1年徒刑,相比之下,对他来说招供的下场仍然略胜一筹。由此可见,招供显然是乐队指挥的最佳做法。
而在捷尔任斯基广场另一个单人牢房里,柴可夫斯基也在做同样的盘算,得出同样的结论。当然了,结果是两人同时招供。
(以上全部出自《策略思维》)
二.不是死局
看过囚徒困境是不是顿时脑袋都大了,——不过这其实才是生活本身的样子。生活本身又是什么样子呢?
生活,意味着不只你一个人。
同在一个世界生存,一个人的选择会随时因为另一个人的选择而改变,何况人心叵测互相猜疑,博弈成了每一个人必修课。不过也不见得学会博弈就能把握一切,因为你不知道对象是不是也懂博弈论对吧。
囚徒困境作为最经典的博弈论案例的适应性也极广,比如五尺巷故事里的两户人家可能都在想“如果我不去扩展对面那家也会扩展的”结果小巷争执纷纷,倒不如各自都让出来留作公共过道;再比如眼下遍布的商业价格战——单方降价会提高收益,但如果每个厂家都降价只会导致整个行业利益巨大缩水,仅有消费者获益。最好的结果却是定最低价,设行规。
(下面线内文本来自百度百科,牧羊人8的《“博弈论”中的经典案例》文章)
“博弈论”研究还发现,在重复博弈中,如果博弈的次数是无限的,博弈方会选择相互合作的策略。因为如果一家企业采取不合作的低价倾销策略,其他企业也会采取相同的策略进行报复性竞争,长期下去,这些企业都将完蛋。企业深谙此理后,便会在相互默契中将价格维持在一个合适水平,尽量避免长期性、大规模的低价杀伤战。美国水表生产的四大巨头企业(班琪表业等)在长达几十年的时期内都维持了这种定价方面的良好合作关系,成为“博弈论”中经常被提及的案例。
但如果重复博弈的次数较少,则合作就不可能实现。如生产彩电的某企业已决定转产而不再生产彩电,它就不会与其他彩电企业继续价格方面的合作,而可能对库存品低价甩卖,因为别的彩电企业对它没有报复的机会了。一些人在快调离原单位或快退休时的拙劣表现,也属此列。
长短期合作的真正考量在于“金钱利益”以外的东西,比如信誉度、优先权等抽象事物。但无论怎么说,长期短期最多只能充当一个条件。
真正打破囚徒困境的关键在于——如何达成合作。如何达成合作的关键在于如何建立一个好的监察机制。
(一)觉察作弊
1.民间:“民间”的意思是当该圈子还未整合为一体时,各自不受拘束的状态。潜规定如“不能减价”无人监管时。
在《策略思维》第四章第四节“惩罚的保证”中就有一条可以说是非常机智的措施了——
(最巧妙的方式在于通过一个保证加以惩罚的承诺推行一个价格联盟,而且是以竞争的名义进行。)
现在我们将要看到的是纽约市及其立体声音响商店大战。疯狂埃迪的口号:“我们不能积压产品。我们不会积压产品。我们的价格是最低的保证如此! 我们的价格是疯狂的。”它的主要竞争对手纽瓦克与刘易斯(Newark & Lewis),口号却没叫得那么野心勃勃。然而每次购物,你都会得到这个商店的“终生低价保证”。按照这一承诺,假如你在别的地方看到更低的价格,商店会按差价的双倍赔偿给你。
在这种情况下,显而易见的就是,消费者的流量将显示出一些端倪,消费者会充当起“监督者”的角色,并且廉价高效。(而且没法贿赂)所以才说是顶顶的高招啊!
2.官方
官方的话自然就好办多了,予以监督、设置惩罚。(不过注意,此官方非彼官方。它是行业的整合,类似微商协会啊什么的,不是指政府。因为只有利益切身相关者才会更多避免暗箱操作或贿赂走私等情况。不过也不是完全没有)
因为囚徒困境中最令人担心的就是——我没占的好处被别人占了怎么说。
那好,谁也别占。谁占谁就得不仅吐出占有的利益还得多交一部分长记性的费用。比如公布违规者的姓名,破坏他的信誉度,硬生生把属于两个人的短期合作扩大为属于对方和整个行业潜在的合作者的长期合作。
所以说毁掉一个人的最好的方法不是给他的当下带来什么实质性打击,比如使他破产,使他被背叛,使他失败——而是使他被贴上一些一辈子都洗不掉的标签。这才算威胁。
在看《御宝》的时候我就一直很喜欢里面随弋说的一句话:“我讨厌麻烦。尤其是不入流的麻烦。”
你现在使我难堪,使我受打击,可是这一切先不说都是可愈合的,何况我会一直成长,咱们来日方长。———至于我处理麻烦的方法就是,我不会给你第二次机会制造麻烦。
你不是不够狠,你只是不聪明。
三.题
好了扯了这么多才讲完一个案例,如果有没说清楚的地方欢迎评论。
现在做一个小的思考题吧。并不难,但需要你动动脑筋,最好是列出解题思路。
这道案例———不是囚徒困境系列。(哈哈,是不是很惊喜~)
三方对决
话说有三个仇家,分别叫做拉里(Larry)、莫(Mo) 和卷毛(Curly),他们决定来一场三方对决。总共有两个回合: 第一回合,每人得到一次射击机会,射击次序分别为拉里、莫和卷毛; 第一回合过后,幸存者得到第二次射击机会,射击次序还是拉里、莫和卷毛。
对于每一个参与对决的人,最佳结果都是成为唯一幸存者; 次佳结果则是成为两个幸存者之一; 排在第三位的结果,是无人死亡; 最差的结果当然是自己被对方打死。
拉里的枪法很糟糕,瞄准10 次只有3 次能够打中目标。莫的水平高一点,精确度有80%。卷毛是神枪手,百发百中。
那么,拉里在第一回合的最优策略应该是什么?在这个问题里,谁有最大的机会幸存下来?
(《策略思维》第十三章第三节)