登陆注册
5488100000008

第8章 打破“囚徒困境”(1)

在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。这个原则的基础是下一步相对于当前一步的权重足够大,即未来是重要的。

囚犯的救赎

为了验证面对“囚徒困境”时人们可选择的策略以及这些策略的有效程度,美国的学者组织了一次以此为主题的计算机竞赛。竞赛要求参加者根据这一困境设计程序,并将程序输入计算机,通过各种程序的相互对局的最后得分评判优劣。

竞赛的游戏方法是:游戏双方都在不知对方将如何选择的情况下,选择合作或背叛。这些选择放在一起就产生了四个可能的结果,即:合作,合作;合作,背叛;背叛,合作;背叛,背叛。在这个游戏中,如果双方选择合作,双方都能得到较好的结果R,即“对双方合作的奖励”。在这个例子中R为3分,3也可以代表参赛者得到的奖金数。如果一方合作而另一方背叛,那么,背叛者得到“对背叛的诱惑”T=5。而合作者则得到“给笨蛋的报酬”S=0。如果双方都背叛那么双方都得到P=1,即“对双方背叛的惩罚”。

参赛者提出了各种程序,但是大致可分为“善良的”、“邪恶的”和“随意的”三类,竞赛的结果也许有些出人意料:“善良”即“以合作为主”的策略大获全胜,而“邪恶”即“以占便宜为主”的策略成绩不佳。

现在考虑一个双方对局的例子。一个对策者采用的策略是每一步都背叛,即“总是背叛”,另一个对策者采用的策略是“一报还一报”,即在第一步合作,然后就采用对方上一步的选择。“一报还一报”意味着在对方每一次背叛之后就背叛一次。当对方采用“一报还一报”时,采用“总是背叛”的对策者,将在第一局得到收益,在而后的对局中都得到相应的回击。这样,这个背叛者只是在第一局得到5分,而在以后的每局都只能得到1分,最终他可能会“战胜”对手,但由于总分仍然很低,而被淘汰出局。

你可能忍不住要问:“什么是最好的策略?”换句话说,什么策略能使对策者得到可能的最高分?这个问题问得很好。但是就像以后要说明的一样,独立于对方所用策略之外的最好决策规则是不存在的。从这个意义上说,“囚徒困境”完全不同于一般游戏,如国际象棋。一个象棋大师可以有把握地假定对手将走让他最头疼的一步,这种假定是这类游戏的基础。然而在这里,游戏者的利益并不是完全冲突的。双方可以通过合作而得到“对合作的奖励”R,也可以通过背叛而得到“对背叛的惩罚”P。如果你假定对方总是走你最担忧的一步,那么,你就会认为其他人总是不合作,这就会使你也不合作,最后招来无休止的惩罚。所以与下棋不同,在“囚徒困境”中假定对方一心要赢你是不可靠的。

事实上,在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。这个原则的基础是下一步相对于当前一步的权重足够大,即未来是重要的。总的来说,如果你认为今后将难以与对方相遇,如果你不太关心自己未来的利益,那么,你现在最好是背叛,而不用担心未来的后果。

这样,我们得到了第一个正式的结论,但却是一个令人伤心的结论,即:如果未来是重要的,就不存在最优策略。

“一报还一报”的伟大胜利

区分善良规则好坏的一个特征是,看它们如何迅速地和可靠地对来自对方的挑战作出反应。一个规则可以被称为“报复性的”,如果它在对方的背叛之后立即以背叛报复。除非一个策略能迅速反应来自对方的挑战,否则,对方将简单地从这样一个好说话的策略身上获得越来越多的好处。

在比赛中,有好几个规则故意使用若干次背叛,试试看它们能否讨到便宜。因此,很大程度上决定善良规则的最后名次的是它们能否很好地应付这些挑战。

对付这类挑战性规则的最好办法是时刻准备报复来自对方“无缘无故”的背叛。因此,善良能得到好处,报复也能得到好处。“一报还一报”综合了这些优点,它是善良的、宽容的和具报复性的。它从不首先背叛,但是不管过去相处的关系如何好,它总能被一个背叛所激怒,而迅速作出反应。

生态分析的结果说明了“一报还一报”的又一个胜利。在最初的竞赛中“一报还一报”领先一点点,而且在整个生态模拟过程中一直保持领先。到了第1000代,它是最成功的规则,并且比任何一个其他规则都增长得快。

“一报还一报”的所有记录是令人难忘的。概括地说,“一报还一报”是62个参赛者中平均得分最高的规则。在竞赛的生态模拟中它一直保持领先。加上它在实验室的对策实验中的良好表现,“一报还一报”显然是一个非常成功的策略。

“一报还一报”的成功可以说明的是它是一个很具适应性的规则:即它在很大范围的环境中表现极佳。它的成功部分是由于其他规则预料到它的存在并且被设计得与它很好相处。要和“一报还一报”很好相处就要和它合作,这反过来就帮助了“一报还一报”。即使那些被设计成伺机占便宜而不被惩罚的规则,也很快向“一报还一报”道歉。任何想占“一报还一报”便宜的规则最终将伤害自己。“一报还一报”从自己的不可欺负性得到好处,是因为以下三个条件得到了满足:1.遇到“一报还一报”的可能性是显著的;2.一旦相遇,“一报还一报”很容易被识别出来;3.一旦被识别出来,其不可欺负性就显示出来。因此,“一报还一报”从它自己的清晰性中得到好处。

另一方面,“一报还一报”放弃了占他人便宜的可能性。这种机会有时是很有利可图的,但是试图占便宜而引来的问题也多种多样。首先,如果一个规则用背叛试探是否可以占便宜,它就得冒被那些可激怒的规则报复的风险。第二,双方的反击一旦开始,就很难自己解脱。

“一报还一报”的稳定成功的原因是它综合了善良性、报复性、宽容性和清晰性。它的善良性防止它陷入不必要的麻烦,它的报复性使对方试着背叛一次后就不敢再背叛,它的宽容性有助于重新恢复合作。它的清晰性使它容易被对方理解,从而引出长期的合作。

你不必每次都赢

虽然预见对于合作的进化不是必要的,但它却对我们很有帮助。因此在这里将分别对参与者和改革者提供建议。

下面为那些处于“囚徒困境”的人提供建议。从个体的眼光看,目标是在与对手的一系列对局中尽可能地得高分。由于这个游戏是“囚徒困境”,参与者会受到背叛的短期诱惑,但是通过与对方建立双方合作的模式可以得到更多的长期好处。对计算机竞赛的分析和理论研究的结果,为我们提供了一些有用的信息,即在不同的条件下什么样的策略会起作用和为什么这些策略能表现得好。这一章就是把这些发现转化成对参与者的建议。

在持续的“重复囚徒困境”中应如何表现,下面是四个简单的建议:

1.不要嫉妒

人们习惯于考虑零和对局,在这种情况下,一个人赢,另一个就输。一个很好的例子就是下棋比赛。为了能赢,一个参赛者必须在大部分时间里比对手做得更好。白棋赢黑棋就输。

然而生活中的大多数情况都是非零和的。双方可以都做得很好,也可以都做得很差。双方的合作是可能的,但并不是总能实现。这就是为什么“囚徒困境”是各种各样的日常情形的有用模型。

人们倾向于采用相对的标准,这个标准经常把对方的成功与自己的成功对立起来。这种标准导致了嫉妒,嫉妒导致企图抵消对方已经得到的优势。在“囚徒困境”的形式下,抵消对方优势只能通过背叛来实现。但是背叛导致更多的背叛和对双方的惩罚。因此嫉妒是自我毁灭。

要求自己比对方做得好不是一个很好的标准,除非你的目的是消灭对方。在大多数情况下,这个目的是不可能实现的。

“一报还一报”由于与其他多种多样策略相处得很好而赢得了竞赛。平均来说,它比竞赛中的其他任何策略都做得更好。但是“一报还一报”从来没有一次在游戏中比对方得更多的分!事实上,它不可能比对方多得分。它总是让对方先背叛,并且它的背叛次数决不比对方背叛的多。因此“一报还一报”不是得到和对方一样多的分,就是比对方略少。“一报还一报”赢得竞赛不是靠打击对方,而是靠从对方引出使双方有好处的行为。“一报还一报”如此坚持引出双方有利的结果,从而使它获得比其他任何策略更高的总分。

因此在一个非零和的世界里,你没有必要非得比对方做得更好。特别当你要和许多不同的对手打交道时更是这样。只要你自己能做得好就没有理由去嫉妒对方的成功。因为在长时间的“重复囚徒困境”中,其他人的成功是你自己成功的前提。

在生意场中也是这样,一个从供应商那儿买来东西的公司期望供方和买方都有好处的成功的关系。妒忌供方的利润是完全没有意义的。任何通过不合作行为(如不按时付账)来减少这种利润的企图,都将激起供方的报复行动,报复行为可以采用多种形式,经常以不明显惩罚形式,诸如拖延发货,较低的质量保证,不愿意打折扣,或者不交换市场条件变化的信息。这种报复使得嫉妒代价很大。买者不要担心卖方的相对的利润,而可以考虑是否有其他更好的购买策略。

2.不要首先背叛

竞赛和理论分析的结果都表明,只要对方合作你也合作就会有好处。竞赛结果是很令人吃惊的。决定一个规则表现如何的惟一最好的特征是这个规则是否善良。也就是说这个规则是否不首先背叛。在第一轮竞赛中,前8名规则中都是善良的,在后7名规则中没有一个是善良的。在第二轮竞赛中,前15名规则中只有一个是非善良的(它名列第8),而后15名规则中只有一个是善良的。

有些不善良的规则,使用相当复杂的方法来试探它是否能逃脱惩罚。例如尝试在第一步背叛,如果对方报复的话,它就马上撤回。在另一个例子中,它在背叛前等待十几步,看看对方是否能被哄骗和被偶尔占便宜。如果是的话,就更频繁地增加背叛,直到对方反击而被迫撤回。但是这些尝试道德背叛的策略都表现得不怎么好。因为存在许多由于愿意报复而不被占便宜的策略,所以导致冲突的代价有时是很高的。

甚至许多专家也没有意识到善良性对避免不必要的冲突的价值。在第一轮竞赛中,由对策论专家送来的规则中几乎有一半是不善良的。参考了第一轮的明显结果,第二轮比赛中大约有1/3规则用不善良的策略,但是,它们都没有占到便宜。

前面的竞赛结果提供了另一个方式来说明为什么善良的规则能表现得如此好,由于善良的规则相互之间相处得很好,因而善良规则的群体是很难被侵入的。而且能够阻止单个变异个体侵入的善良规则的群体也能阻止这个变异规则的任何小群体的侵入。

当然,你可以尝试更保险的方式,即先背叛直到对方合作,才开始合作。然而,竞赛的结果表明,这实际上是一个很有风险的策略,因为你的最初的背叛就可能引起对方的报复,并使你处于要么被占便宜要么双方背叛的两难境地。如果你惩罚对方的报复,这种反应就会一直延续下去。如果你宽恕了对方,你就得冒被欺负的风险。即使你能避免这些长远问题,对你的最初背叛的当下报复会使你希望自己从一开始就应该是善良的。

对竞赛的生态分析揭示了另一个为什么首先背叛是很冒险的道理。第二轮竞赛中前15名规则中惟一的非善良策略是名列第8的“哈林顿”。因为它与竞赛中的名次较低的规则相遇的得分都很高。在假想的未来生态竞赛中,名次较低的规则在群体中的比例越来越小,最终能被这个最初挺成功的非善良策略占便宜的策略就越来越少,接着它自己也消亡了。因此,只会占“傻瓜”的便宜是没有用的,它只不过是一个自我毁灭的过程。这个教训说明,虽然不善良在最初看来似乎是很有希望的,但长期下去它将毁坏使自己成功所必需的环境。

3.对合作与背叛都要给以回报

“一报还一报”超常的成功给出了一个简单的但又是很有力量的建议:要回报。在第一步合作之后,“一报还一报”只是简单地回报对方在上一步的所为。这个简单的规则惊人地有效。它赢得了第一轮“囚徒困境”计算机竞赛,并取得比任何其他由对策论专家们送来的规则更高的平均得分。每一个第二轮竞赛的参加者知道这个结果,但“一报还一报”又赢了第二轮竞赛。这个胜利显然是令人惊讶的。因为每一个参赛者都是在考虑了“一报还一报”在第一轮竞赛中的胜利结果之后,才提交参赛规则的。显然人们都希望能干得更好,但是他们错了。

“一报还一报”不仅赢得竞赛本身,而且在假设的继续比赛中比其他任何规则表现得都好。这表明“一报还一报”不仅与最初的各种规则相处得很好,而且能与那些可能在未来群体中占较大份额的成功的规则相处得很好,它不毁坏自己成功的基础,相反它在与其他成功的规则相互交往中繁荣起来。

同类推荐
  • 经济如此动荡,你要早作打算

    经济如此动荡,你要早作打算

    有了货币,自然产生投机;有了投机,便不可避免地产生泡沫;因为泡沫,经济便出现大的动荡。无论是1997年的亚洲金融危机,2007年的美国次贷危机,抑或是至今仍然蔓延的欧债危机,都给世界经济带来了大的动荡,我们既然身处“地球村”中,自是无可躲避。在全球经济动荡的背景下,《经济如此动荡,你要早作打算》深入剖析了中国泡沫经济产生的深刻根源和制度背景,并通过分析不同国家和地区曾经发生的泡沫经济,寻找中国泡沫经济的独特规律,预测及展望中国未来的经济趋势。经济如此动荡,我们要尽量避免陷入泡沫破灭的陷阱,清醒地等待机会的到来,早作打算。
  • 郎咸平说:萧条下的希望

    郎咸平说:萧条下的希望

    中国当下经济到底怎么了,大家众说纷纭,官员、企业家和老百姓大多一片迷茫。郎咸平教授在本书中明确告诉各位读者:中国经济萧条已经到来,这就是我们今天面临的惨状。萧条也意味着希望,如果没有“次货危机”,美国经济就不会像今天这样健康。郎咸平教授经过认真研究和分析认为:政府推动的所谓调整结构,转型升级,其实都是伪命题。政府需要做的是管好自己那只好动的“手”,营造好的营商环境,才该是应该做的。今天的萧条,就是政府造成的。要走出萧条,政府也必须束缚自己那只好动的“手”。郎咸平教授在本书总结道:只有砸碎束缚中国经济发展的十大枷锁,中国改革的的新红利才能实现,中国经济才有走出萧条的希望。
  • 智能移动终端支撑下的非现场经济

    智能移动终端支撑下的非现场经济

    《智能移动终端支撑下的非现场经济》一书的写作是基于:1.我国正处在经济结构转型的关键期;2.我国ICT产业已经.彤成了国际同步的态势;3.我国ICT研究领域基本上停留在工程技术人员群体,我国经济学界涉入该领域较浅或较少;4.综观世界近十年来诺贝尔经济学奖得主,其理论成果基本都是集中在信息经济相关的经济学理论;5.笔者率先提出“非常经济概念”,是采取交叉学科研究的方式,意图填补我国“非现场经济”研究的空白;6.高等教学的学科内容应该始终走在社会发展实际的前沿;7.经济学研究和应用分析的平民化趋势。
  • 后谷歌时代:大数据的没落与区块链经济的崛起

    后谷歌时代:大数据的没落与区块链经济的崛起

    《后谷歌时代》一书的作者乔治·吉尔德是一位颇具远见卓识的智者。他在技术和文化领域具有无与伦比的视野和见地。他向读者描述了谷歌所面临信任与安全危机,并勇敢地预测了即将到来的后谷歌时代。谷歌的“搜索和排序”能力吸引了世界。看似免费小应用,诸如视频、地图、电子邮箱等让用户欲罢不能。但一个没有价格竞争的体系必将扼杀创业精神,并最终将互联网变成广告的荒原。缺乏信任与安全是谷歌致命的弱点,且当前的计算机和网络体系无法解决这一危机。如果价值和安全不是信息技术体系结构的组成部分,那么这个体系结构必将被替换。作者认为长期由少数巨头把持的互联网将面临着一场“大拆解”。
  • 下一轮经济危机2:中国凭什么幸免于难

    下一轮经济危机2:中国凭什么幸免于难

    虽然人们将爆发的危机命名为美国次贷危机、美债危机、欧债危机,可为什么中国的经济同样那么艰难?如果说,中国经济下滑的重要原因在于外部环境的恶化,那为什么中国的股价下跌得比美国和欧洲的大部分国家都要严重呢?作者认为,这一轮经济危机的实质在于创新的停滞。创新停滞导致生产力增长乏力,社会支出大于社会产出,主权债务如雪球般越滚越大。而政府基于社会和经济稳定的诉求,在错误思想的指导下,释放流动性,制造通胀。“货币把戏只能收到表面的一时之效,从长远看它肯定会让国家陷入更深重的灾难。”政府对解决危机的一次次拖延,使危机积蓄力量,蓄势待发。
热门推荐
  • 云阁美人

    云阁美人

    三年前,云绮儿被送离云家去了寒岭寺,于某日半夜死亡,一个飘荡的灵魂在机缘巧合下替她活了下来,一夜之间,云绮儿性格大变,有时冷漠有时二。三年里,暗地里救遗孤,或者走投无路的孩子,后来人多了,便创立云阁。以女子偏多(没办法,重男轻女啊)。三年后回到云尚书府,她替生了,有的人就该为原先做的蠢事,付出代价。
  • 废材逆天祸国妖姬

    废材逆天祸国妖姬

    情丝截,不愿回忆伤心切,伤心切,心如蛇蝎,心似碎屑。梦魇打出同心结,心中血泪不停泻,不停泻,酒池之外,枯风残月——秦楼月
  • 感动学生的品德故事

    感动学生的品德故事

    “少年强则国强”,为了中华民族的崛起,我们有责任也有必要培养体魄健康、意志坚强、乐观进取的亿万青少年。根据青少年的成长特点和需要,在参照了大量的专业书籍、通俗读物的基础上,精心编写了这本《感动学生的品德故事》一书,希望能够为青少年塑造优秀品质、成就卓越人生起到积极的推动作用。
  • 木天禁语

    木天禁语

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 画山水序

    画山水序

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 玩转唐朝之魔鬼厨娘

    玩转唐朝之魔鬼厨娘

    《玩转唐朝之魔鬼厨娘》:她是一个知名大学营养学专业毕业的高级营养师工作性质:私人厨师惨遭强暴后,她纵情于声色之中,年轻,美貌,性感的化身,游走于各个多金男雇主的身边,诱惑他们,然后把他们都拖下了水.谁说只有男人才可以成为掠艳高手的?女人同样也可以!!直到有一天,后一任女雇主请来一个杀手结束了她堕落的生命。至此,她这才获得了新生灵魂飘向了地狱阎王、秦广王怎么也来了?只可惜她还有一段未了的情债打翻孟婆汤,在秦广王之女相助下来到了古老的唐朝唐穿越,变成了一个寺庙里的小尼姑?!念经,担水,劈柴,有了上顿没下顿???嘿嘿,王府贴出了广招厨娘的告示,包袱款款,姑娘我化身太监大摇大摆的走进王府大门王府的老大是一个懦弱王爷?什么?懦弱王爷说自己没有男子乞丐?妈呀,又来个个同性恋太子!还说自己长的很“水灵”,让他忍不住上下其手?杀太子?武则天的阴谋?争夺权势?好危险哪,我到底能不能保住小命呀我的妈呀,这日子这么过的这么猥琐呢?!不行,她要一定奋起反击,魔鬼厨娘来也——******************************************************《玩转唐朝之唐妩妍舞》:落梅宫中伤心舞,蓬莱殿上恩爱长深宫紧锁无人问,无欲无求事半哀美人如花宫廷转,山不就水水自来诞下麟儿为太子,量其身份不是妃她,是先皇的才人,从未受过恩宠,竟然也被列入了陪葬之列?他,是新皇,后宫佳丽三千,皇子无数,却执意立她的孩子为太子!本文架空,亲们不要深究其历史性,喜欢的话就收着看吧,梦倾力的一篇文文,会有阴谋,但是总体来说还是温情的~~
  • 庄子内篇订正

    庄子内篇订正

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 声入我芯

    声入我芯

    冬日的暖阳,照耀着大地银铃般的笑声,混在一群小盆友的稚嫩童声中……一眼万年多年后“你个变态,当年居然学跟踪”“嗯,那不是跟踪,是送你回家”“你还更改我地址,让我笔友找不到我”“那是帮你过滤交友”……“……”当大灰狼发现老婆电脑里N年前他的照片满脸委屈的说“原来,你才是大灰狼……”
  • 十年卧底黑道

    十年卧底黑道

    事出偶然,我盯上了黑道1966年1月24日,我出生在一个偏远的村子里。我的父亲是一位病退军人,在我八岁那年去世了,撇下母亲一人拉扯着我们姐弟四人艰难度日。初中毕业后,我因家庭困难缀学回家务农。十八岁时,由政府照顾安排到镇政府工作。后来我还做过乡办企业的厂长。直到我准备竞聘乡团委书记的那年,我突然觉得我的世界观发生了一些变化。确切地说,是缘于1993年的一件偶然的事情,那年我二十七岁。弟弟高志祥带了一帮朋友来家里赌牌喝酒。
  • 一位卡车司机

    一位卡车司机

    一位退役的特种兵去当了一位卡车司机,可在他上任后的第一年遇到了意想不到的事情,他和老板发现了8号车厢的秘密,一张纸条的发现使得Convey公司的命运从此改变······