这其实是事先设计好的一种博弈“困境”。如果选2,每个学生所得到的钱都比选1的学生得到的钱多50美分,这个假设也是有现实意义的,因为生产假冒的产品本身要比生产真正的产品获利多。只不过,选2的人越多,他们的总利润就会越少,这个假设同样是有现实意义的,因为假货越多,其产品的信誉就会越低,所以他们赢利就会越少。
现在假设27名学生都选择1,那么他们每个人都将得到108美元;如果其中一个人偷偷选择了2,背叛了别人,改变了决定,那么选择1的人就剩下26个,而他们将比27人都选择1少得到4美分,也就是拿到104美元,可是那个背叛者却会拿到154美元,它拿的比27人都选择1多出46美分。
事实上,无论开始选择1的人有多少,其结果都是一样的,因为选择2是一种优势策略,每个选择2的人都会多拿46美分,而他的举动会让其余26个人每人少得到4美分,所以全班的总收入会少58美分。如果这27个人中,每个人都选择了这种优势策略,以让自己的收益达到最大化,那么他们将各得到50美分。可是,他们如果达到一种合作的协议,暂时把个人的收益减少到最小,那么他们将在最后得到108美元。身为局外人的你会怎么选择呢?
在这个选择开始之前,教授提出的规则是不允许学生在一起讨论,以防他们“狼狈为奸”,但是给他们很长的选择的时间,所以他们还是“合谋”了,在达到利益最大化的协议时,有大约14个人同意选择1,可是最终的结果是只有4名学生选择了1,因此,27个人的总收益是1582美元,比大家合作少1334美元。“合谋”的领导者说:“以后我再也不会相信哪个人了!”但是你可知道这些同学为什么选择2?
“囚徒困境”为人们探讨合作是怎样形成的提供了非常形象的说明,同时也为合作产生的不良结局做出解释,因为每个人都会从自己的角度去思考问题,这正是合作没有达到利益最大化的原因。在“零和博弈”中提到的双赢设想就是因为存在“囚徒困境”这个问题所以才无法实现。
“囚徒困境”可以说是无孔不入的,它存在于生活的各个角落,连政治高手们也会变成困境中的囚徒。
1984年,很多人都清楚美国联邦预算赤字的确是高得有些过分了。裁减必需的巨额开支在政治上也是可以实行的,所以,大幅增税应该说是不能逃避的问题。可是,没有人愿意担任政治领导这个角色,谁都不想带头主张这么做。曾经有一位叫沃尔特·蒙代尔的民主党总统候选人在自己参加竞选时,想用这个政策的转变为自己制造声势,却被罗纳德·里根打得落花流水。因为里根曾许诺过不加税,在里根当选以后,这个问题就陷入了僵局,不管如何划分政治派别,是共和党还是民主党,是参议院还是众议院,他们都希望把提出加税方案的主动权推到对方头上。
他们都明白,如果双方联合起来,一起提议削减开支和加税,能够一起分享荣誉、分担责任。这么做和同时被动坚守、眼看着巨额赤字上升而自己无动于衷比起来,显然是对国家有利的,就算是对他们个人的政治生涯来说,他们也会从中得到一些好处。而反过来,如果是自己先提出这种策略,对方却坚守被动,且不附和自己,那么自己就会受到一定的打击。从各种角度看,最好的结果都是对方提出削减开支和加税政策,巨大的政治代价由对方去付,自己只享受利益。
现在可以把这种情况看成是一种博弈。共和党和民主党是博弈的双方,为了表示谁更倾向于现有的政策,非常明显,对他们中的任何一方来说,保持被动都是一种优势策略。正是这种态度导致了一种真实发生的“囚徒困境”:这一届国会没有制定任何加税政策。这也是美国为什么是世界上最强大、最富有的国家,同时也是最大债务国的原因。
当个人的利益和集体的利益发生冲突时,每个人都想追求自己的利益,因此导致了一个对所有人都不利的结局,这也是博弈论中著名的“纳什均衡”。而“囚徒困境”的最差结局正是一种“纳什均衡”。
只有当人们都愿意替对方着想时或者双方经过“合谋”时,才可能得到对双方来说都是最好的结果,也就是所谓的双赢。但想达到这种结果是很难的,虽然合作的确是比背叛更有利的“利己策略”,可是它却有一个前提——人人都可以做到,人与人之间的不信任让这个前提几乎成为一种幻想。
“囚徒困境”渗入人类的各个角落,这种理论已经深入到社会的方方面面,无论是国际政治、军事经济以及文化领域,都是猜疑多于信任的,非合作的情况比合作的情况更为常见。现在社会上很流行“博弈”这个词,我们的每种举动似乎都处在博弈之中,所以“囚徒困境”作为博弈的一种还将继续困扰着我们。
“尔虞我诈”,终成“偷鸡不成蚀把米”
2002年到2005年间,美国有一个竞赛表演节目叫“是敌是友”,它是在竞赛表演广播网放映的,这是一个以真人形式进行“囚徒困境”博弈的节目,只不过情景是人为的。
这个竞赛中会选出3对合作者参与竞赛。在每对合作者被淘汰出局时,他们就会产生一种“囚徒困境”的博弈,因为他们要决定怎样分配他们的奖品。
假如他们都选择合作,那么奖品将被平均分配。假如其中一个人背叛了,那么合作的人将什么都得不到,而背叛者将会得到所有的奖品。假如两个人同时背叛了,那么他们将一无所获。
需要注意的是,这个支付矩阵和标准的“囚徒困境”并不相同,这里“对手背叛、我合作”“同时背叛”,对个人来说损失是相同的。与标准的“囚徒困境”稳定均衡相比,“都背叛”是不稳固的均衡。假如你知道对手会背叛你,这时你无论怎样选择都没办法影响你的奖品。
这个支付矩阵为:假如双方都合作了,每人都将得到1;两个人同时背叛,两个人都会得到0;假如A背叛而B合作,A得到2,而B得到0。
当然,“是敌是友”参赛者只能进行一次博弈,它并不适合重复博弈的观点,所以对方根本没办法“以牙还牙”。在这个节目中,每位参赛者都可以做一个声明,让另一个人在双方均不知道对方背叛与否前,确信他是对方的朋友。
然而,事实证明,知不知道对方的策略对“囚徒困境”似乎是没有影响的。因为即使提前知道对方的策略,“背叛”依然是最好的选择,无论他获知对方选择朋友还是敌人都一样,大不了双方都空手而归。
其实,“囚徒困境”中的囚徒假如坚持彼此合作,是可以为双方赢来最佳利益的,可是在资讯不明的情况下,他们知道出卖合作者能为自己带来利益,也知道合作者出卖他们能为自己带去利益,所以最后他们彼此出卖了。
这种现象在生活中很常见,也就是说在一个集体中,也许每个人的选择都是理性的,可是对整个团队来说却是不理性的。
其实,在股市中“博弈”的人也是处于一种“囚徒困境”里。对博弈双方来说,在股市涨到最高点时,无论是对企业还是对散户来说,哪一方的最大利益都是“我卖,你没卖,所以我获利了”,然而他们的最理想状态却是“一起选择不卖,以便把股市推到一个更高的点上,这样每个人就都有更大的利润空间”。可真正的结果却是大相径庭的,虽然人人都明白其中的道理。可见“囚徒困境”在这个事件中起到了关键性的作用。
人们都明白合作是最理想化的摆脱困境的策略,可是假如当出卖别人可以换得自己的平安时,出于本能,人们是会趋利避害的。
有位技艺高超的捕鸟师,一天下午,他和徒弟一同出门捕鸟。师徒二人在沙滩边悄悄地把网张开,撒下了许多食物,之后他们就躲进芦苇丛里,安静地等着鸟儿自投罗网。
食物的香味很快就把鸟儿引来了。刚到的鸟儿聒噪地呼朋引伴,没一会儿,就有成群的鸟儿拍打着蓬松的翅膀,一齐向这边飞过来。
也许这些鸟儿真的饿坏了,它们一落下就狠狠地啄食,保持警觉的它们也不忘在吃东西的时候向四处乱看。正当这些鸟儿为饥饿时能找到这样美味的食物而庆幸的时候,捕鸟师突然一拉绳子,“呼啦”一声,没等这些平时一有风吹草动就迅速飞走的鸟儿张开翅膀,就把它们全罩在网里了。捕鸟师和徒弟马上跑过去想按住网,可是这个大网居然腾空飞起。原来,网里有一只很大的鸟,它先张开翅膀向上飞,其他的鸟见了,也跟着努力拍翅膀,于是,鸟儿带着网一起飞了起来。
平日里“老死不相往来”的鸟儿居然在生死存亡之际合作起来。徒弟感到无望了,可是捕鸟师抬头看了看快要落山的太阳,又看了一眼飞起的大网,对徒弟说:“这些鸟儿飞不远了,我们快跟上去。”徒弟觉得很纳闷,但还是按照师傅的话做了。他们跟着鸟跑了半个小时,还没追上那张网,其他人都说他们是傻瓜,可是捕鸟师对此却毫不理会,依然全力追网。
就在太阳将要落山时,网突然整个掉了下来。捕鸟师立刻扑上去,把鸟儿们全部抓住了。徒弟感觉很奇怪,问:“你怎么知道网会落下来?”
捕鸟师回答:“每当夜幕降临时,这些鸟儿都将回巢,他们来自不同的地方,于是有的往南飞,有的往北飞。它们为了各自的利益,闹成一团,不再像起初那样齐心协力了,所以网就掉落下来。”