何帆老师的专栏《大局观》里有提到1910-1940年美国的住宅革命。大意是原来的房屋都是各自独立的,而进入了20世纪之后房子就渐渐连接了起来,比如各家都通了电线,布好了水管,自来水和污水分开排放,有了照明电灯,装了电话,住宅开始变得网络化。而联网革命的好处则是带来了人民财富的大爆发,也使得社会渐趋于公平。值得思考的是1910-1940年代包含了美国最大的一次经济危机和二战,但却没有阻止住宅网络化的发展。
世界总有一些底层的逻辑在一直流动和推进,而博弈论也属于这些底层逻辑中的一种。
什么是博弈论?
先来说个例子,超市货架上物品的摆放是有窍门的,比方说把对顾客来说折扣多的,性价比高的商品摆放在靠上或靠下不容易看到和拿取的位置,而把对超市来说利润高的商品放在与顾客视线齐平的位置。这样一来对于不常来购物的顾客,就有很大概率会直接选择视线范围内的商品。但这是商家和顾客的博弈么?不是,这只是商家的小诡计,小聪明。而且这种小聪明仅对偶尔光顾的客人有效,对于每天都来逛超市,熟悉货品摆放位置的老太太,或者只关注自己想要的东西的顾客来说就失效了。
对于“聪明人”来说,长期、反复、帮手、具体、行动是他的五个敌人。
博弈论的基础假设是:人人都是老司机。所谓“老司机”有三个标准。
1、偏好明确:看一个人脑子清楚不清楚,就是看你的偏好是否明确。比如在选择水果时你就是偏爱香蕉多于葡萄。
2、据此行动:不落实在行动上的观念,是不牢靠的观念。既然有了偏好,就会按偏好行动。比如你的偏好是喜欢香蕉然后是葡萄。那么在自助餐厅拿水果时你就会按先香蕉后葡萄这个顺序来选择水果。
3、考虑代价:买水果时,如果发现香蕉贵的离谱,那就坚定的选择葡萄。
在这样一个基础假设上,博弈论有两个立论点∶1、博弈的双方都是老司机,像孙膑的“田忌赛马”并不是博弈论,而是欺负人。2、双方的博弈是动态的,当你的采取行动的时候,对手也会采取相应的行动。
比如说,假如你是一名篮球队员,你的右手控球非常厉害,如果对方也知道这一点,在场上比赛时,他们就会着力防范你的右手控球。对于你来说,你应选择的最佳策略是不能总用你的右手控球,其核心目的是让对手搞不清楚你要用哪个手,从而无法得出最佳应对策略。
约翰.冯.诺依曼带给我们的启示
在博弈论的世界里,冯.诺依曼提出过一个“完美的扑克决策理论”。这一理论是这样考虑的:
1、我如果把这个策略摆到桌面上,哪怕对手知道我用的是这个策略,也拿我没办法。
2、哪怕咱俩都是聪明人,我使用这个策略也是最佳策略。
3、我不是靠你的愚蠢去赢你,我是靠真正的策略。
具体操作起来是这样的:类似于德州扑克的玩法,如果我有一手好牌,我的最佳策略是继续下注,诱使对手跟牌;如果我有一手差牌,我的最佳策略是立刻摊牌,输掉,重新开始新的一局;而如果我有一手一般的牌,那我的策略还是继续下注,因为摊牌必输,还不如继续摸牌可能还会摸到好牌,而且这样会给对手造成混乱,不知道我继续下注的真实原因,从而影响他的判断。
罗胖说得到之前有公开他们的品控手册,这就是一种和竞争对手打明牌的策略。我的知识服务做的好,我就能够同所有竞争对手公开我的品控标准,换句话说就是我不怕对手抄袭。还有一层考虑就是品控最终是落实到人来执行的,即使对手公司人员掌握品控内容,还是要靠员工来执行,而得到的品控手册本身就是最好的招聘广告,会吸引认同得到价值观的优秀求职者前来,所以手册的最后一页是招聘电话。
同样的道理,为什么创业者永远是靠边缘创业有效。因为在一个行业里,大公司就好比拿到了一手好牌,它必须一直下注,诱使小公司跟随,这样大公司才能掌控和制定行业方向,在自己制定的发展方向中,毕竟自己最有优势。
而小公司就好比拿着一手一般的牌,它能做的就是“使诈”,不跟随大公司的指引方向,另辟蹊径,打出其不意的仗。
冯.诺依曼带给我们的启示是:在博弈论中所有的确定性都是“坏东西”。包括:确定地赢得少,确定地输,还有让他人知道自己的确定性。
正如很多人在职业发展上的发问:“我现在的工作发展空间不大,看不到未来,我是否需要辞职?”何必要做一件做不大,且没有未来的事情?确定性的赢的少,在这个时代比确定地输还差。
正如罗胖所说,随着大航海时代来临,即使你不跟随船只起航,那至少要在岸边摆个水果摊 ,来赚航行回来的船员的钱。
约翰.福布斯.纳什给我们的启示
冯.诺依曼提出的博弈论策略有两个问题:
1.对策论的计算太复杂。
2 现实中不是所有人都是聪明人。
我们来看博弈论中的一个经典案例“囚徒困境”。有两名囚徒被抓起来各自隔离审讯。如果两人相互背叛,都坦白罪行,则两个人各自被判刑8年;如果一人揭发,一人沉默,则揭发的人无罪释放,另一人被判刑十年;若两人都选择沉默,则会因证据不足而各自被判刑一年。整体来看,对两人最有利的策略是两人都沉默,这样只需被判刑一年就可以出狱了。但对每一位囚徒来说背叛对方意味着自己可能会被无罪释放,这个诱惑大于相互合作;而被背叛的代价也大于主动背叛。所以在这一困境里,对每位囚徒来说,最利己的策略就是背叛对方。
在囚徒困境中,双方相互背叛的结果就是一个“纳什均衡”。所谓的纳什均衡就是说不管方怎么选,我都只能这么选。不管怎么变,都不会有更好的选择。
这也由此引申出了两个启示:
1、对个体来说最理性的选择,对整个社会来说,不一定是最优选择。
2、一个由理性人构成的社会,不一定是个美好的社会。
那么如何解决囚徒困境呢?有几种方法:
1、建立人脉,建立熟人关系。比如两个囚徒中一个是老大,一个是小弟,那么小弟就要考虑如果这次为老大背锅,那么他的家人可能会得到好的照顾,出狱后还会有好的工作机会等他。但若是他背叛的话,可能出去后就没法立足了。
2、进行重复博弈,尤其是在商业合作上,如果两家公司存在多次合作机会,那么相互背叛的可能性就比较小。但若双方知道这次是最后一次合作,那么有极大的可能会背叛以谋求一次大收益。
3、既然私人的最优导致社会的非最优。那么就让政府出面进行干预,比如庇古税。
布鲁斯·布尔诺·德·梅斯奎塔的启示
布鲁斯·布尔诺·德·梅斯奎塔应用博弈论的大家,著有一本奇书《独裁者手册》研究落后国家的独裁政权以及分析西方民主政府的阴暗面。对于独裁和民主政治的区分有其独到的见解。
在梅斯奎塔看来真正影响博弈的不是算法 而是对未来的预期,未来可以影响现在。比如当今大国间的核武器建设,因为各国间都知道只要动用核武器双方都玩完,所以预期的核战争仅是起威慑左右,反而维持了现在的和平。照这个思路来看,参与博弈的最重要的手段,就是你能够描述未来,而未来是可以自我实现的。就像《小王子》中说的:“如果你想造一艘船,不要抓一批人来伐木,不要指挥他们做这个做那个,你只要教他们如何渴望大海就够了。”
除此以外,梅斯奎塔还是位做局的高手。举个他买车的例子:在他决定好想要买的车的型号和配置后,他让他的女儿分别给所有能联系的车行打电话。首先给第一家车行打电话,将他的要求“在当天下午三点前他要买好一辆车,现在他所知道的最低报价是多少”统统告诉对方,然后问:“你会有更低的报价么?”。如果车行给了他更低的报价,他就开始给第二家车行打电话,询问同样的问题,然后第三家,第四家......直到接近下午三点前,他可能会拿到一个匪夷所思的报价。在这个例子中,梅斯奎塔设了一个局,而这个局由他一人掌控,所以他能够最终“挤出”一个最低价格。
还有一个关于拍卖的例子,在某些拍卖会上,拍卖规则中有这么一条:“如果当前竞拍价格已经超出竞拍人能够承受的范围,那么就请竞拍人自动离场。”这条规则就是一个局,没有一位竞拍人会愿意在众目睽睽之下承认自己没有足够的钱来购买商品,他宁可在场上坐着。而这样的结果就会让那些仍在竞价的人认为别人还能出得起更高的价格,所以拍卖价格就会越来越高。
所以说如果我们能精心巧妙地去设计一个制度或一个局,那么就能从中获得很大的利益。
博弈论是一个同具体场景强关联的学科,所以它并没有一定有效的策略,有的只是“看情况”。
最后,以罗胖在跨年演讲上说的一句话同大家共勉:“没有道路可以通向真诚,真诚本身就是道路。”