博弈方面的专家用无数事实证明,在无限次重复博弈的情况下,其合作关系将趋于稳固。假如不是出于无奈,两个理性的人是不会在重复博弈时背叛对方的。
一锤子买卖与长期合作
在2005年,获得诺贝尔经济奖的托马斯·谢林和奥曼两位经济学家,通过聚焦效应和重复博弈等合作博弈论研究,指出冲突双方基于重复博弈过程得益的总体情况,从而认识到“合作有利于自身利益的选择,从而使合作的机会大大增加。”
在公共场合,两个陌生人很可能会为一个座位甚至是谁踩谁一脚而争吵,但是,如果这两个人是认识的,他们就会互相谦让,因为他们还有可能进行长期的交往;另外,像旅游景点和火车站,这种人群流动性较大的地方,可能商品的质量、价格以及服务都非常差,而且还有假货横行的现象,这些商家其实就是抱着和买者之间不会有“下一次”交易的心理,因为旅客很少因为他商品的物美价廉而再次光临,所以在正常情况下,商家会选择一锤子买卖。在其他领域中也是这样。
有限次的博弈产生了“囚徒困境”,这种例子在现实中屡见不鲜,不过这些问题都是有条件限制的,而在无限次重复的博弈里,合作是非常有可能的。
中美双方纺织品贸易的持续进行也因利益的分配而发生了一些变化,矛盾和冲突不断出现,慢慢地双方便形成了一种重复博弈的模式。因而为了双方长期甚至是永久性的利益,两国都选择了合作。
因为在中国和美国纺织品贸易的博弈里,双方的合作收益显然远远高于不合作的收益,所以双方最理想的选择应该是引致正和,赢得合作。而且这种合作还会不断地产生新的共赢。
2005年11月8日,中美双方就纺织品贸易签订了一项协议,对美国来说,它们对纺织品行业实施了一定程度的保护,使其实现了向纺织品一体化的顺利过渡,而且还获得了有关人民币汇率等方面问题的进展;对中国来说,中国在3年的协议期内市场份额和出口增长量比2004年有所提升,而且美国明确表示对协议外产品克制使用242条款。这些协议内容表明,中美双方都对此前各自坚持的利己立场做了让步,说明中美双方都对维护稳定贸易环境的重要性做了充分的考虑,并在很大程度上顾及到双方合作的利益,这可以说是一个双赢的协议。
在博弈关系中,虽然一次性博弈时博弈双方都会努力寻求对自己最有利的结果,采用“占优策略”来博弈,可是这种非合作性质的博弈会导致双方同时进入“囚徒困境”的“纳什均衡”,最终反而得到较差的结果,对双方而言,一次性的博弈很难实现“帕累托最优”。可是当博弈发展至重复博弈时,在有限次的重复博弈里,每个阶段也可能出现单次博弈的均衡结果,也就是说有限次的重复博弈也无法抑制投机行为,而且同样很难使双方都选择合作,因此它也不是博弈者的最佳选择,有限次博弈一般会产生非合作均衡。但是无限次的博弈却会使“囚徒困境”在重复博弈里获得纠正。
中美双方长期的纺织品贸易博弈是一个和无限次重复博弈类似的随机结束的重复博弈,在这样的情况下,博弈双方决策和分析的思路都和无限次重复博弈类似。所以最终产生了合作行为。
其实,无论哪种博弈,博弈者的策略选择都是依据自身利益的大小而定的,这个条件在重复博弈里依然是成立的。可问题是重复博弈的得益和有限博弈不一样,因为它们的每个阶段本身也是一种博弈,双方都有得益,而不是整个博弈完成后才产生的收益,因此,博弈双方必须考虑得很长远,考虑到下一次甚至下几次的博弈,假如每位博弈者都根据当前阶段的得益进行选择,那么等于是把重复博弈分割成了一个个博弈,重复博弈也就没有意义了。所以在重复博弈中,双方的行为、策略一定是兼顾其他阶段的得益并考虑整个重复博弈过程得益的总体情况。
如果双方还会进行合作或竞争,他们就会共同找出一个利于双方的办法。
但这并不是说友谊是博弈双方合作的必要条件,博弈毕竟也是一种交易,有时即使是敌人,只要互相都有利可图,并且满足其关系持续的条件,就有可能合作。
比如,第一次世界大战期间,英军和德军在战壕战中遇到了3个月的雨季,于是双方在这3个月里达成了一种协议,不攻击对手的粮草供养,在大反攻的时候可以拼个你死我活。
虽然在重复博弈里,长期的合作可能纠正人们短期冲动的行为,可是也需要注意,也许双方签订某个协议并不难,可难的是博弈双方是否仍然会因为随机事件或者自己可能获得的更大利益而选择“背叛”,这时就要看双方所定的协议对各方是否具有非常强的约束力。此时,就需要一些带有惩罚意味的约束形成,我们可以把这种契约称为带剑的契约,这对保证双方的合作关系是十分有效的,这种带剑的契约一般为法律,不遵守契约的一方将会受到惩罚,因此,双方就更不愿意在重复博弈中背叛对方了。
为什么要有游戏规则
博弈论认为,无论是一次性还是有限次重复博弈,人们从自身利益的角度出发,最终会使已经制订的合作协议无法稳定地存在。事实上,决定合作协议是否能够被双方同时执行最关键问题有两个,第一个是承诺,即在“囚徒困境”中,双方互许承诺,告知对方在下次博弈时会选择对对方有利的行为;当然单有承诺是不可靠的,对方往往还有出卖自己的可能,此时威胁也是一种游戏规则,以避免使自己受到损失,这便是游戏规则的力量,这种带糖也带刺的契约是人们合作的基础和保障。
其实,在生活中,这种承诺和威胁是非常普遍的现象。比如女人会告诉自己的丈夫,假如他敢不忠于婚姻,只要被发现一次,就马上离婚,这就是一种威胁,而丈夫出于多方面考虑,会向她发誓,这便是承诺。
这些都揭示了人们行事的准则。
至于合作成功与否,关键看承诺和威胁力度有多大。比如一个软弱且遇人不淑的女人,在一次又一次原谅胡作非为的男人时,其结果往往是男人的得寸进尺,因为对方知道无论如何,只要用一些花言巧语就能让女人原谅自己。在这样的情况下,女人的威胁对男人是没有作用的。其他合作也是一样,假如合约对双方的约束力很小,那么合作的可能性就很小了。
如果是一个可信度非常小的承诺或威胁。就好像参加考试的同学承诺在没有老师监考的情况下也不作弊一样,实在难以想象,没有老师监考的考场将会是一种怎样的情景。
并不是每个学生都是道德非常高尚且极具自制力的人,即使监考老师在场,依然有学生敢顶风作案,这时,假如监考老师制定一条规则,告诉他们假如有同学作弊定然会严惩不贷,比如直接判定考试成绩为零分,学生们便会主动和监考老师合作了。
从现实生活来看,如果在有限次重复博弈中想取得好结果,最佳方法就是合作约束,也就是靠某种形式约束对方,这种形式可以是某种规则,比如法律。
法律是一种规则,也是让人愿意主动遵守约定的一种最有效的方法,在法律的约束下,囚徒困境往往能得以改观。
甲公司和乙公司是商业上的合作伙伴,甲公司经常向乙公司购买原材料,因为两家公司位于不同的城市,所以两家公司经过商谈之后签下了买卖合同,通常在每周的最后一天,甲公司会把现金打到乙公司的银行账户中,而乙公司则立刻发货到甲公司,如果一方违约,将处以交易额2~6倍的罚款。
事实上,从博弈角度看,假如甲公司和乙公司都是理性的人,那么他们的合作将算是一个有限次数重复博弈,也就是说在没有法律约束存在的情况下,他们两家公司中无论哪次交易,都可能出现不遵守合约的行为,即使是乙公司货源充足,甲公司现金充足也难以避免这种现象。
可是,在合约约束的情况下,甲公司与乙公司的最佳策略都是合作。假设甲乙两家公司每年的交易都是十次,每笔交易为100万元,双方各获利20万,如果一方违约,则会被罚款200万元以上。
在这场博弈中,甲公司和乙公司都选择合作,双方均收益20万;
如果甲公司付款了,而乙公司没有发货,则甲公司损失100万,乙公司获益100万;
假如甲公司没有付款,而乙公司发货了,甲公司收益则为120万,乙公司损失80万;
双方均未有所动作,则双方收益为零。
很显然,这可以算是一种有限次重复博弈的“囚徒困境”,在没有合同约束的情况下,双方可能选择不合作以获得更大的利润。可是在有合同约束的情况下,双方则都选择了合作,因为如果自己违约了,对方将有权罚款,而且有司法部门强制执行。
于是理性人也选择了合作的策略,主动完成合约对各方所要求的行为。简单一点说,这其实是一种游戏规则,也就是法律改变了两家公司博弈的均衡结果。
一种游戏规则能规定对某种行为采取一定的惩罚措施,可是假如惩罚措施缺乏力度,除去惩罚以外,背叛者仍然能从“背叛”行为中获得好处,而且这种好处远远大于他采取合作策略所带来的好处时,那么这种游戏规则则是无效率或者说是低效率的。所以从这个意义上看,游戏规则制定的越严格越有效率。
强制性和有游戏规则是十分重要的。比如在冷战时期,美苏两个超级大国40多年的军备竞赛就是因为缺乏一个强有力的规则。
虽然这两个国家都签订了一些制止军备竞赛的合约,可是因缺乏一个具有强制性的法律环境,双方依然陷入了无法摆脱的“囚徒困境”中。
游戏规则也可以是道德上的约束,它是外界强加于人身上的,让人们不能违约,它可以破解“囚徒困境”的问题,化解个人理性和群体理性的冲突,使整个群体走向稳定。比如人们会因为畏惧社会舆论而主动放弃“背叛”,选择合作。
一位动物学家曾经做了这样一个试验:他准备了一只很大的笼子,并在笼子顶端安装了喷水装置,在笼子的另一端挂着一个桃子,还安放了一架梯子直达这个桃子,之后在笼子的另一端放进4只猴子。
猴子A发现桃子,可是在它的爪子刚触摸到梯子时,试验人员马上把笼子顶端的喷水装置打开了,笼子内顿时下起了“倾盆大雨”,猴子A马上收回双臂遮住脑袋,其他3只猴子也赶忙用双臂遮雨,等没有猴子触摸梯子时,喷水装置就关闭了。
雨过天晴后,猴子A又准备顺着梯子去拿桃子,可是当它的爪子再次触摸到梯子时,实验人员又开启喷水装置,不过A还是拿到了桃子,但它同时也领悟到桃子和被雨淋之间的模糊关系,于是放弃了再拿桃子的念头,自动返回到笼子的另外一端。
过了一段时间,猴子B准备去拿桃子,它走到梯子跟前,在爪子碰到梯子时,喷水装置开启了,猴子B吃到桃子,可是大家都因此挨淋了。猴子们慢慢发现,虽然有少数猴子吃到桃子,可是其他猴子都被淋湿了,重复了很多次后,有一伙猴子就自觉地行动起来,当另一批猴子被放到笼子里时,它们就会打那个猴子一顿,每当新来的猴子想去拿桃子,以前的猴子就会打它,最后猴子们合作起来,没有猴子去动那个桃子了。
在这个故事中,猴子间产生了“道德”。假如这群猴子能构成一个社会,它们也将告诉自己的后代拿那只桃子对其他猴子不利,所以不要为了自己而拿桃子,因为这种背叛的行为会让大家遭殃,而且自己也会受到一定的惩罚。
这个故事同时也反映了人类道德的形成过程。
虽然人的天性是自私的,每个人都努力让自己获得最大的利益,可是当面对众人的压力时,人们也不得不放弃一部分利益。不过,这种约束远远没有法律的约束力强,在生活中的道德约束失灵也很常见。假设一个人捡到很少的钱,有可能会上交,因为这会为他带来美誉,可是如果他捡到上百万元,则极有可能据为己有,因为道德上的满足感比起巨大的利益来说已经算不了什么了。
在道德作用失效的情况下,强制的法律规则就不可替代地成为约束理性人的主要办法。