新近的关于多人囚徒困境博弈的实验室实验,采用了一种叫作捐款博弈的形式。每个参与者得到一笔初始资金:10 美元。每人可选择保留其中一部分,再把另一部分捐给共同储金。然后,实验者把累积的共同储金翻倍,在所有参与者之间平分,捐款人和非捐款人都同等对待。
假设在这个组中总共有四个参与者:A、B、C 和 D。不论其他人怎么做,A 只要向共同储金捐献 1 美元,共同储金翻倍后就会增加 2 美元。但是,增加的 2 美元中,会有 1.5 美元分给 B、C 和 D;而 A 只能得到 50 美分。因此,A 提高了其捐献量,最后却亏了本;相反,他减少捐献量反而会获益。不论其他人捐多少(如果有捐款的话),这一点都是成立的。换句话说,对 A 来说,一分钱也不捐是优势策略。对 B、C 和 D 来说亦是如此。这个逻辑是说,人人都应当希望成为一个分享别人成就的“免费搭车者”。如果四位参与者都采取他们的优势策略,共同储金便空空如也,每个人只保有他们的初始资金 10 美元。当人人都想成为免费搭车者时,车就会停滞不前。如果人人把他们所有的初始资金捐给共同储金,那么,翻倍后的共同储金将是 80 美元,每个人将分到 20 美元。然而,每个人都有背叛这样协议的个人动机。这就是他们的困境。
捐款博弈不仅仅是实验室或理论上的奇事;它还发生在现实世界的社交活动中——只要群体成员自愿捐款就能共同受益,但却不能阻止没有捐款的人也能享受到这些利益。村庄对洪水的控制、自然资源的保护就属于这种情形:不可能建了堤坝后,洪水就会有选择地绕道而行,只淹没那些没有捐款帮忙建设堤坝的人的田地;拒绝以后把鱼分给那些过去消耗太多的人,也是不可行的。这就产生了多人囚徒困境:每个参与者都有偷懒或保留贡献的动机,却指望能享受别人的贡献带来的利益。如果大家都这么想,总的贡献量就会很少甚至为零,结果大家都遭受了损失。这些情形普遍存在而且如此严重,以致所有社会理论和政策都需要深入思考才能走出困境。
在该博弈中的最有趣的变体中,参与者有机会惩罚那些背叛隐含社会合作契约的人。但是,他们必须为此承担个人成本。在捐款博弈结束后,参与者被告知其他参与者的个人捐款量。然后开始第二阶段的博弈,参与者可以采取降低其他人赢利的行动,而其他人的赢利每降低 1 美元,他自己要付出 33 美分的成本。也就是说,如果 A 选择把 B 的赢利降低 3 美元,那么 A 这样做之后,他的赢利就会减少 1 美元。这些减少的赢利不会再分配给其他任何人;而是返还到实验者的总资金中。
实验结果表明,人们对“社会欺骗者”实施了大量的惩罚,惩罚的可能性也大大提高了博弈第一阶段的贡献量。这样的惩罚似乎是促成合作、增进群体利益的一个有效机制。但是人们实施惩罚的事实首先就是令人惊讶的。以私人代价惩罚他人的行为,本身就是对集体利益的贡献,所以它是一个劣势策略;如果它以后成功地引导欺骗者采取了更好的行为,这将对整个集体有利,而惩罚者将只得到该利益中属于他的一小部分。所以,惩罚不是自私估计的结果。情况的确如此。在关于该博弈的实验进行的同时,参与者的大脑接受了正电子放射扫描仪的扫描。[5]结果表明,实施惩罚的行为会刺激某个大脑区域,该区域被称为背侧纹状体,它与体验快乐或满足有关。换句话说,人们从惩戒社会欺骗者的行为中,实际上得到了心理上的受益或满足。这种本能必定有着很深的生物根源,而且可能是因为其进化优势而被选择出来的。[6]