博弈论

千呼万唤始出来,终于要写我心心念念的博弈论了。说到博弈论大家心里肯都有两个问题,

1、博弈论是什么?
2、学习博弈论有什么用?
博弈论是多个个体或群体在特定条件制约下,利用相关方的策略,而实施自身对应策略的学科。就好比下棋,敌我对弈,为获得胜利,如何见招拆招。
那有什么用呢?生活中充满着博弈,理解其中隐藏的规律,才能为我所用。通过对博弈论的学习,我得到一个结论,在现实生活中 多次重复博弈的前提下,“一报还一报”是最优策略!
善意为先,以直报怨,以德报德

640.webp.jpg

好了,写到这我觉得自己已经把博弈论中学到的对自己有用的结论写来了,而且我将坚定的按照这个规则执行。

如果有兴趣进一步了解博弈论,例如 博弈论是怎么产生的?经历了哪些发展过程?现代的博弈论是什么?还有刚刚我说的“一报还一报”是如何被实验证实的?那就随我继续往下看。

博弈论的产生

(为什么要谈博弈论的产生呢,所有的知识或理论,总有它开始的地方,如果想抓住其本质,就要从这里开始)

说到博弈论的产生不得不提一位大神,冯诺依曼,他可能是一个比爱因斯坦还要聪明的人!很小就精通多国语言,可以同声传译,在数学、医学、经济学、计算机科学等多门学科都有所建树。他一生对很多领域都有强烈的探索的兴趣。博弈论就产生于他的一个偶然的兴趣,有一天他想打扑克有没有稳赢不输的方法?于是出了《博弈论与经济行为》一书,宣布了博弈论的诞生。

举个简单的栗子,梭哈(也就是比大小)
游戏规则:2-5个人围在一起比大小,支付赌本后,每人一张底牌,底牌在对决时才可翻开。从发第二张拍,每发一张牌,以牌面者为先,进行下注。 有人下注,想继续玩下去的人,选择跟,跟注后会下注到和上家相同的筹码,或可选择加注,各家如果觉得自己的牌况不妙,不想继续,可以选择放弃,认赔等待牌局结束,先前跟过的筹码,亦无法取回。

最后一轮下注是比赛的关键,在这一轮中,玩家可以进行梭哈,所谓梭哈是押上所有未放弃的玩家所能够跟的最大筹码。等到下注的人都对下注进行表态后,便掀开底牌一决胜负。这时,牌面最大的人可赢得桌面所有的筹码。

这个时候应该怎么玩?手里拿到了大,中,小 牌时应如何应对?
1、拿到大牌时,一定想办法赢得更多,诱敌深入,加注;
2、拿到中牌时, 直接翻牌,胜面不大的前提下,无论输赢,降低风险;
3、拿到小牌时, 必须加注!为什么呢?从两方面来看。一方面,不加注,必输,加注可能赢;另一方面,要让对方搞不清自我的套路,兵者诡道也,让对方猜不出我是大牌加注还小牌加注。
这是博弈论在比大小中迎面比较大的策略。

至此我才知道,原来声名赫赫的博弈论最初是从游戏中发展而来的,是在既定的规则下,双方心理和智力的比拼。

博弈论中有意思的模型

囚徒困境

故事内容是,两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。

· 若对方沉默,坦白会让我获释,所以会选择坦白。
· 若对方坦白指控我,我也要指控对方才能得到较低的刑期,所以也是会选择坦白。

这就是著名的囚徒困境,这个故事反映个人最佳选择并非团体最佳选择。

知道囚徒困境有什么用呢?如何破解囚徒困境?
囚徒困境用数学语言描述就是两个条件:
1、背叛诱惑>合作报酬。在这里,合作报酬是判刑1年,而背叛诱惑却是立即释放。
2、受骗支付>背叛惩罚。在这里,背叛惩罚是判刑8年,而受骗支付却是判刑15年。

看到这里,破解之法就显而易见了,我们只要让“背叛诱惑<合作报酬,受骗支付<背叛惩罚”就可以了。

背叛诱惑<合作报酬。即你帮大哥顶罪,家里的妻儿老小大哥都会帮你照顾,而且等你出来还会给你一笔钱;
受骗支付<背叛惩罚。即如果你敢揭发大哥,小心你全家性命。
纳什平衡

是指在一个博弈过程中,无论对方采用什么策略,我都会选择某个确定的最优策略,在这个博弈中谁单方改变策略,谁就会损失,纳什平衡就是这种博弈的稳定结果。

囚徒困境就是一个很好的例证,它是一个坏的纳什均衡。

学习纳什平衡有什么用呢?如何破解坏的纳什平衡呢?

还是以囚徒困境为例,如果两个嫌疑犯事先有约定,都不坦白,如果有人背叛,则外面的其他兄弟会惩罚他。
即用制度去制约坏的纳什平衡,让其向好的方向发展。生活中的商业战争也是一样,要善用协议约束,避免坏的纳什平衡,实现共同利益最大化。
智猪博弈

两头猪,一头大猪,一头小猪,在一个狭长的猪圈中,踏板和食槽在两端,踩下踏板食槽供食,一只猪踩踏板另一只猪就能坐享其成先吃,而踩踏板需要消耗能量。

具体情况如下:
如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;
如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;
如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;
如果双方都懒得动,所得都是0。

这里的纳什平衡是:大猪踩踏板,小猪不动。明显是个小猪占优的策略。

了解智猪博弈有什么用呢?这个故事给了我们什么启示?

如果把大猪比作大企业,小猪比作小企业,小企业要懂得合理搭便车,实施“占优策略”分得市场。大企业要懂得利用专利保护等制度设计,制约小企业占便宜。
公地悲剧

什么是公地悲剧?
在公共草原上,每个理性的牧羊人都追求个人利益最大化。但多放牧会带来两个结果,一是增加单只羊的收益,二是增加草原的负担,可能导致过度放牧。但因为草原是公共的,每个牧羊人无法限制其他牧羊人的放牧,自己不放牧资源也会被其他人占用,每个人都追求个人利益最大化,导致过度放牧,草原退化,这就是公地悲剧。

了解公地悲剧有什么用?如何破解公地悲剧呢?

了解公地悲剧的根本原因是公共资源不占用就吃亏的感觉,每个人都想占便宜,这种捞一把的心态导致了公地悲剧。
用两个方法去破解,一是公地私有化,就像小岗村,分田到户。公地私有化后人们就失去了捞一把的心态;另一个是强监管,通过公共资源有偿使用、许可证使用来管制,避免公地悲剧。
重复博弈

是指同样结构的博弈重复许多次,它可以是对称信息的博弈,也可以是不对称信息的博弈;

了解重复博弈有什么用?

理解了重复博弈,才不会在意一城一池的得失,用时间的维度的丈量成败。诚信是一种与这个世界重复博弈的心态。
当双方是一锤子买卖时,很可能宰你没商量。但如果把一次博弈变成重复博弈,总体利益就能抵抗住短期诱惑,大家就会更讲诚信。
不完全信息博弈

区别于囚徒困境、纳什平衡、智猪博弈、公地悲剧这些完全信息博弈,现实生活中很多博弈是不清楚对手的信息和策略的,像这种不了解对象特征、规则、策略等信息的博弈称为不完全信息博弈。

了解不完全信息博弈有什么用?

在我们了解对方特性、游戏规则和常用策略的情况下,我们会如何博弈,当没有这些信息,或者彼此不清楚对方是否知道这些信息的时候,如何博弈?

了解不完全信息博弈,可以通过制造信息不对称,获得策略优势,例如“空城计”。也可以通过特定方法,刺探对方军情,打破信息不对称,为我方争取策略优势,如“木马计”
维护和打破信息不对称,是双方的重要策略。
拍卖博弈

一架满载飞机,有几位重要旅客急需搭乘,如何用最少的代价,让其他旅客让出座位呢?
用拍卖博弈的策略,由低到高叫价,先叫先得。由于旅客彼此不知愿意下飞机的代价是多少钱,害怕错失机会,都会抢先同意举手。于是这种策略付出的代价最小。

拍卖博弈有什么用?

善用这种“不完全信息博弈”,激发博弈者们“自相残杀”,让时间最不值钱的旅客下飞机,获得最高收益。
零和博弈

是指参与博弈的双方在严格竞争的环境下,一方获益必然导致另一方损失,获益和损失之和永远为零。双方不存在合作可能。

学习零和博弈有什么用?如何避免零和博弈?

零和博弈会导致你死我活的内部竞争,但往博弈中加入增量,零和博弈就会变成正和博弈。先确定“存量分配规则”、“利益分配机制”,不容博弈发生,打开封闭系统,注入新的元素,这样创业公司才不会只盯着已经赚得的钱如何分,而是在既定利益分配机制的前提下,想如何扩大盘子赚更多的钱。
一报还一报

美国密西根大学教授罗伯特·阿克塞尔罗德做了一个博弈实验,他写信给不同背景的学者,请他们把应对“囚徒困境”的策略写成程序,让这些程序捉对厮杀,经过十几万次的重复博弈,最终“一报还一报”的策略获得了胜利。

这个实验让我更加坚定,在生活中要秉持善行,用惩罚回报恶行,用善行回报善行;
在没有被欺骗之前永远不要主动欺骗他人。如果对手选择背叛,立刻反击。如果对手补偿,不计前嫌继续合作。这样的清晰规则会激发对手的合作动机。是长期博弈最有利的策略。

写在最后,最近写作的过程中我的观念又发生了些变化,是受我的 parter 黄sir 的影响(哈哈,我自己偷偷给她取的外号)。我一直喜欢写大而全的东西,但这种东西真的不好写,容易铺的太广而写不透,而且很烧脑。

她是每天坚持写作,而且最近看她的文章写的越来越好,我们都订阅了老师的专栏,而我可能听听就过了,她会听完记下来,而且结合到自己生活中的小事,写出感想。这点触动了我。所以我想试试,从一个个小灵感小启发开始写,积累一个个小故事,一次只说清楚一件事。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容

  • 大家早安、午安、晚安,今天我先从机器学习的学习中休息一下,来了解一些常见的博弈论模型,然后继续学习机器学习等。以下...
    keepStriving阅读 46,471评论 3 72
  • 博弈论是二人或多人在平等的对局中,各自利用对方的策略变换自己的对抗策略,达到取胜的目的。有以下几个模型: 囚徒困境...
    微芳阅读 1,590评论 0 4
  • 文/土豆书生 晨阳起了 我在地平线等你 夕阳坠了 我在月影里等你 秋叶落了 我在满地的金黄里 想象你...
    牧马天山阅读 258评论 0 1
  • 孩子别怕,这世界还有爱 文 / 凉爽 “志愿者官网”微信公众号发布了一篇文章,《又现虐童视频,跪求转发找到受虐女孩...
    杨靖心理阅读 500评论 0 0
  • 雨,自清晨始就未停歇。时大时小,忽急忽缓。 银川的初夏仍然踯躅在暮春的节奏里,阴雨绵绵中依旧延续着春寒料峭的感觉。...
    介山散人阅读 211评论 0 0