盖尔-沙普利算法 课程分享14
这是通识选修课《经济研究中的计算方法》第六讲课例之一,旨在说明一种选择背景下的博弈算法。
一、罗伊德·沙普利
2012年,美国罗伊德·沙普利(Lloyd S. Shapley,1923-2016)与埃尔文·罗斯(Alvin E. Roth1951-)因“稳定配置理论和市场设计实践”(for the theory of stable allocations and the practice of market design)的贡献共同获得了诺贝尔经济学奖。在颁奖典礼上,当年近九十的沙普利颤颤巍巍地登上领奖台时,掌声响起,实至名归。而这一切的发生,最初不过是源于沙普利和伙伴大卫·盖尔(David Gale,1921-2008)之间的一场关于婚姻的讨论。
罗伊德·沙普利,1923年出生于美国马萨诸塞州的剑桥市。他的父亲是当时美国鼎鼎有名的天文学家——哈洛·沙普利。他不仅是美国知识界熟悉的公众人物,同时也是政治上的活跃人物之一。出身于这样的家庭,沙普利如果选择子承父业学习天文学的话,那么无异于踏上了自己事业成功的康庄大道。
但是沙普利选择听从内心。相比于星空的广袤无垠、星图的宏伟壮观,沙普利似乎更偏爱数学的严谨。因此进入哈佛大学后,他开始学习数学。然而大学第三年,第二次世界大战爆发,沙普利应征入伍。
因为这样的家庭,沙普利耳濡目染之下,对于天文学也有一定的了解。进入军队后,他就被任命为气象预报员。1943年,沙普利被派遣跟随美国陆军航空队,越过太平洋、毛里塔尼亚、印度、喜马拉雅山,最近辗转到达中国成都支援抗战。
1944年,沙普利因破解了日本的气象密码而获得美国青铜星章。
战争结束后,沙普利重新回到哈佛校园。在取得学士学位后,他转至普林斯顿大学继续学习数学。
沙普利刚刚进入普林斯顿学习,就被冯·诺依曼认为是博弈论研究领域里最明亮的新星。沙普利的思路十分敏捷,而且相当清晰。一个同龄人评价他“能做很好的数学演讲,知道很多东西”。《美丽心灵---纳什传》一书中也提到过约翰·纳什对沙普利的看法:“沙普利完美无缺,一个才华横溢的数学家,战斗英雄,哈佛学生,哈洛的儿子,冯·诺依曼的宠儿,塔克也对他有所偏爱。沙普利在老师和学生中一样讨人喜欢,是普林斯顿校园中少有的几个人物之一。”
沙普利在生活中扮演着良师益友的角色。当纳什在为自己论文想出一个例子而绞尽脑汁时,沙普利花费好几个星期帮他提出并证明了一个复杂而精妙的例子。
二、盖尔-沙普利算法(GS算法,Gale-Shapley algorithm)
1960年,大卫·盖尔问沙普利:“不论人们一开始的最佳选择是谁,人们最终都能获得稳定的婚姻吗?”
沙普利最终在回信中回答:“让每个男生先向自己最佳选择求婚,然后让女生们在追求者中选出最喜欢的那一个,但先不告诉这个男生,而是告诉其他男生他们已经被拒绝。直到再也没有追求者出现,女生才告诉她最喜欢的那个男生,他被接受了。接着那些被拒绝了的男生会向他们的第二选择、第三选择求婚,直到被接受为止。最后,每个女生都只剩下一个追求者。这时候他们的婚姻就是稳定的,因为男方和女方都会对拒绝过他们的异性产生反感。”
征婚选择的最佳策略:“有n个美女逐个介绍与你约会,依序每次只见一个,你选了她就没机会见到后面可能更好的;如果让她走了,也许后面都不如她,问怎么选结果最好?”这问题经数学推演后有个很简单的一般结果,最大概率选到了心仪美女的策略是:对于n个依次来临的机会,首先对前[n/e]个仅仅作了解,不做选择,然后开始将约会的与前面所有见到的相比,如果更好就接受,否则等下一个。这里e=2.71828…,[n/e]是n/e的整数部分。
1962年沙普利和大卫合写了论文《高校招生与婚姻稳定性》,并发表在《美国数学月刊》上。看似两个风马牛不相及的事情,被这二位发现了相同的数学形式,不得不佩服数学家的敏锐目光。在这篇文章的基础上,后人不断将其应用于社会的各个方面,比如高校招生、肾脏匹配等,大大促进了社会的发展与稳定。
盖尔-沙普利算法没有用到什么高深的数学,罗斯的应用基本也是套用公式定理,他们只是把数学应用的本领发挥了出来。套用公式定理的数学应用比较简单,基本是将与公式定理适用的实际问题,规范整理一下,直接套用就行了。对于离现成理论比较远,不大靠近规范的数学问题,就需要剔除枝节抓住重点,抽象归纳成一个数学模型,然后寻求数学的答案。
由此可见,此奖本应三个人分享,包括原先加州大学的大卫·盖尔教授,遗憾的是,他已经去世了,而诺奖规则只授予在世的专家。实际上,是大卫·盖尔和沙普利做出了理论方面的结果,而埃尔文·罗斯后几年在很多实际应用方面落实了,做出了具有现实意义的贡献。
这课题虽然以“征婚选择”为切入点,其实谈的是对于n个依次来临机会,最佳选择策略的公式和定理。现实中遇到的相亲、考大学、求职、选项目和逛商店买东西,都是符合这公式和定理的应用。
直观起见,这里以一个“电梯选物”的例子说明盖尔-沙普利算法。
有三包米,大、中、小各一袋,分别放置于1、2、3楼电梯门口外。一人在电梯内,从1楼升至3楼,只能取其中一袋,当然希望越大越好。如果随机取,则取得大、中、小袋的概率均为1/3。
现在我们应用盖尔-沙普利算法,在[n/e]=2楼时做出选择。即,在一楼不取,只看米袋大小;升至二楼看,比一楼大就取走,比一楼小就升到三楼取。这样的策略得到米袋大小的概率分别为:大1/2,中1/3,小1/6,见下图所示。
三、沙普利的中国情结
战争结束后,沙普利回到哈佛大学继续念书,在1948年取得数学学士学位,随后进入普林斯顿大学数学系,一路念到博士毕业,他的博士导师也是约翰·纳什的导师塔克(A.W.Tucker)教授。此后,他长期在美国著名的“战略思想库”兰德公司工作,1981年后,则一直担任美国加州大学洛杉矶分校数学和经济系教授。
2002年8月14日到17日,沙普利因为参加青岛大学承办的“2002国际数学家大会‘对策论及其应用’卫星会议”,再次来到中国。青岛大学的高红伟教授作为会议组织者,至今还留着一份为沙普利办理入境签证时青岛市政府出具的邀请函原件,“沙普利被誉为博弈论的无冕之王,精通博弈理论,但却不太喜欢现代的信息技术,不喜欢使用电子邮件与别人进行沟通”。昔日的英武少年已成为一个科学“老顽童”,他不拘小节,动不动玩“消失”。一次,高红伟派十几个学生把他找到时,发现79岁的教授没有回宾馆,而是在大厅的沙发上睡着了,而且一睡就是3个小时。
青岛之行,沙普利再次讲述起他与中国将近70年的渊源时,依然激动。
四、诺贝尔奖
1.奖项
诺贝尔奖(瑞典语:Nobel priset,英语:Nobel Prize)是指根据瑞典化学家诺贝尔(阿尔弗雷德·贝恩哈德·诺贝尔,Alfred Bernhard Nobel,1833年10月21日-1896年12月10日)1895年的遗嘱而设立的五个奖项,包括:物理学奖、化学奖、和平奖、生理学或医学奖和文学奖,旨在表彰在物理学、化学、和平、生理学或医学以及文学上“对人类作出最大贡献”的人士,并于1901年首次颁发。奖金为他捐出的3100万瑞典克朗所产生的利息和其它收益。
1968年瑞典中央银行为纪念其成立300周年,增设“瑞典中央银行纪念诺贝尔经济科学奖”,该奖于1969年首次颁发,人们习惯上称这个额外的奖项为诺贝尔经济学奖。
诺贝尔奖的甄选委员会通常在每年10月公布得主。颁奖典礼于每年12月10日,即诺贝尔逝世周年纪念日,分别在瑞典首都斯德哥尔摩和挪威首都奥斯陆由国王举行授奖仪式。
遵照诺贝尔遗嘱,物理学奖和化学奖由瑞典皇家科学院评定,生理学或医学奖由瑞典皇家卡罗林医学院评定,文学奖由瑞典文学院评定,和平奖由挪威议会选出。经济奖委托瑞典皇家科学院评定。每个授奖单位设有一个由5人组成的诺贝尔委员会负责评选工作,该委员会三年一届。
2.为什么没有数学奖?
对这个问题有许多猜测:
A.数学太理论化:作为一名发明家和实业家,诺贝尔设立奖项的初衷是为了奖励那些对世界有益的、杰出的“实用”发明或发现。他可能认为数学太理论化,没有太多实际应用。
B.数学并不有趣:诺贝尔自己的研究领域是物理和化学,他对文学感兴趣,而医学在世纪之交开始走向成熟,和平奖的设立是为了改善他作为发明炸药的“死亡商人”的公众形象。而他对数学既不感兴趣,也不需要感兴趣。
C.当时已经有著名数学奖:瑞典和挪威的国王奥斯卡二世本身就是数学家,他设立了一个著名的数学贡献奖。诺贝尔可能认为自己没必要复制一个已有的知名奖项,何况,他感兴趣的那些领域正好需要设置一些享有声望的奖项。
D.爱情:有传闻说诺贝尔之所以没设数学奖,是因为诺贝尔心仪的女人被当时瑞典最著名的数学家抢走了。恨屋及乌,诺贝尔就不想设立数学奖,因为首次很可能颁给他。
还是觉得A靠谱些。结合诺贝尔的遗嘱和后来颁奖的情况看,该奖的确更青睐那些对人类社会的文明进步有“看得见效果”的成果,包括自然的和社会的。这样,没有数学奖就可以理解了。
不仅如此,就连物理学奖都必须是经过实验或观测证实的理论才授奖。比如大名鼎鼎的天体物理学家霍金就终生无缘诺奖;爱因斯坦的相对论和引力理论也没有得奖,他1922年获奖的成果是光电效应定律,评委会的通知直接说:“没有考虑您的相对论和引力理论的价值,将来这些理论得到确认后再考虑。”
正因如此,一些诺贝尔奖颁奖成果的周期很长,有的甚至经过几十年的检验后才颁奖。特别是经济学奖,一个理论看到效果,往往需要很长时间,而经受住时间考验的好东西,诺贝尔奖组委会才敢颁奖。但诺奖又规定不颁发逝者,于是有人说,要得诺贝尔经济学奖,不但要聪明,还要长寿,比如约翰·纳什,比如罗伊德·沙普利,以及大卫·盖尔的遗憾。
说回前面的话题,虽然诺贝尔没有设立数学奖,但还是有不少数学家得到过诺贝尔奖。这里面最多的就是经济学奖,比如约翰·纳什(1994年)和罗伊德·沙普利(2012年)都是数学家,还有1975年的苏联数学家康托罗维奇,1983年的美国数学家G·迪布鲁,等等。有人戏言,诺奖没有数学奖,于是数学家组团去拿经济学奖。
此外还有,1979年,美国数学家阿兰·柯马克因为创立了计算机X射线断层成像(CT)的数学理论,从而获得了诺贝尔医学奖。
1985年,美国数学家赫伯特·豪普曼因为与物理学家卡勒合作发明X射线直接测定晶体结构的数学方法,从而获得了诺贝尔物理学奖。
3.评奖程序
根据诺贝尔遗嘱,在评选的整个过程中,获奖人不受任何国籍、民族、意识形态和宗教信仰的影响,评选的第一标准是成就的大小。
然而,某些奖项有时带有明显的政治倾向,也是众所周知的。
诺贝尔奖之所以得到世界公认,原因之一是它的评奖程序公平。获得者事先一无所知,既不用把自己科研成果一一上报,也不需要填表,更无需自吹自擂成果有什么独创和高明,不可能拉关系、走后门、行贿等等。评奖程序是由同行专家提出推荐,再由权威专家评判。评判后,发布消息,最后通知本人。
实际上,历史上有3个人在去世后获得诺奖。
第一位是瑞典诗人卡尔费尔德。他是诺奖评委和终身秘书,一生中多次被提名,自己都为避嫌而拒不接受。所以在他去世半年后,被追授了1931年诺贝尔文学奖。
第二位是联合国第二任秘书长达格·哈马舍尔德。1961年9月18日,他在刚果飞机失事遇难,一个月后他被追授了诺贝尔和平奖。
1974年开始,诺贝尔基金会规定:诺贝尔奖原则上不能授予已去世的人,所以以后就不会有这类情况出现了。
但第三位特例还是发生了。2011年,瑞典卡罗琳医学院宣布拉尔夫·斯坦曼凭借“发现树突状细胞及其在后天免疫系统中的作用”而另外两位科学家分享诺贝尔生理学或医学奖。在诺贝尔委员会公布得奖名单前三天,2011年9月30日,斯坦曼因胰脏癌离世,诺贝尔委员会维持授奖的决定,他仍然获得诺贝尔奖。拉尔夫·斯坦曼成为目前最后一个去世后追授的人。