用惩罚回报恶行,用善行回报善行
在没有被欺骗之前永远不要主动欺骗他人。如果对手选择背叛,立刻反击。如果对手补偿,不计前嫌继续合作。这样的清晰规则会激发对手的合作动机。
什么叫“一报还一报”?
“囚徒困境”中,虽然“合作”对双方都是最有利的,但囚徒往往会因为自私和不信任,选择彼此背叛,两败俱伤。这种坏的纳什均衡令人沮丧:难道人的天性就不适合合作?为此,美国密歇根大学教授、《合作的进化》的作者罗伯特·阿克塞尔罗德快定做个实验。
罗伯特写信给不同背景的学者们,请他们把自己应对“囚徒 困境”的博弈策略写成电脑程序。罗伯特收到了14个程序,然后他让这些程序捉对斯杀,最后按总得分排名。
著名的“一报还一报”终于出场了。这个策略由加拿大心理学家拉波特教授提出,其基本逻辑是:第一回合采取合作策略然后每一回合都采取上一回合对手的策略。这也就是所谓的:人不犯我,我不犯人;人若犯我,我必犯人。
听起来很简单。但就是这么简单的“一报还一报”,居然在后来十几万次重复博弈的“囚徒困境”中获得了冠军。
为了验证“一报还一报”的威力,罗伯特很快又组织了第二场比赛。这次他收到了62个程序,其中有不少程序专门针对“一报还一报”做了改进,包括多次合作后突然背叛的“狡猾策略”、总是选择合作的“老好人策略”等。但最后依然是原生的“一报还一报”获胜。罗伯特继续公开征集能打败“一报还报”的程序,但20多年过去了,“一报还一报”至今无敌。
这个实验给了很多人启发,也让大家重新相信:一报还报,好人终有好报。
中国有句成语叫“以德报怨”。这句成语其实出自《论语》——或曰:“以德报怨,何如?”子曰:“何以报德?以直报怨,以德报德。”翻译成白话就是,有人说:“用善行回报恶行,怎么样?”孔子说:“那用什么回报善行?用适当的惩罚回报恶行,用善行回报善行。”
孔子所说的“以直报怨,以德报德”,就是美国罗伯特教授说的“一报还一报”。