新近的关于多人囚徒困境博弈的实验室实验，采用了一种叫作捐款博弈的形式 | 南国微雪

　　新近的关于多人囚徒困境博弈的实验室实验，采用了一种叫作捐款博弈的形式。每个参与者得到一笔初始资金：10 美元。每人可选择保留其中一部分，再把另一部分捐给共同储金。然后，实验者把累积的共同储金翻倍，在所有参与者之间平分，捐款人和非捐款人都同等对待。

　　假设在这个组中总共有四个参与者：A、B、C 和 D。不论其他人怎么做，A 只要向共同储金捐献 1 美元，共同储金翻倍后就会增加 2 美元。但是，增加的 2 美元中，会有 1.5 美元分给 B、C 和 D；而 A 只能得到 50 美分。因此，A 提高了其捐献量，最后却亏了本；相反，他减少捐献量反而会获益。不论其他人捐多少（如果有捐款的话），这一点都是成立的。换句话说，对 A 来说，一分钱也不捐是优势策略。对 B、C 和 D 来说亦是如此。这个逻辑是说，人人都应当希望成为一个分享别人成就的“免费搭车者”。如果四位参与者都采取他们的优势策略，共同储金便空空如也，每个人只保有他们的初始资金 10 美元。当人人都想成为免费搭车者时，车就会停滞不前。如果人人把他们所有的初始资金捐给共同储金，那么，翻倍后的共同储金将是 80 美元，每个人将分到 20 美元。然而，每个人都有背叛这样协议的个人动机。这就是他们的困境。

　　捐款博弈不仅仅是实验室或理论上的奇事；它还发生在现实世界的社交活动中——只要群体成员自愿捐款就能共同受益，但却不能阻止没有捐款的人也能享受到这些利益。村庄对洪水的控制、自然资源的保护就属于这种情形：不可能建了堤坝后，洪水就会有选择地绕道而行，只淹没那些没有捐款帮忙建设堤坝的人的田地；拒绝以后把鱼分给那些过去消耗太多的人，也是不可行的。这就产生了多人囚徒困境：每个参与者都有偷懒或保留贡献的动机，却指望能享受别人的贡献带来的利益。如果大家都这么想，总的贡献量就会很少甚至为零，结果大家都遭受了损失。这些情形普遍存在而且如此严重，以致所有社会理论和政策都需要深入思考才能走出困境。

　　在该博弈中的最有趣的变体中，参与者有机会惩罚那些背叛隐含社会合作契约的人。但是，他们必须为此承担个人成本。在捐款博弈结束后，参与者被告知其他参与者的个人捐款量。然后开始第二阶段的博弈，参与者可以采取降低其他人赢利的行动，而其他人的赢利每降低 1 美元，他自己要付出 33 美分的成本。也就是说，如果 A 选择把 B 的赢利降低 3 美元，那么 A 这样做之后，他的赢利就会减少 1 美元。这些减少的赢利不会再分配给其他任何人；而是返还到实验者的总资金中。

　　实验结果表明，人们对“社会欺骗者”实施了大量的惩罚，惩罚的可能性也大大提高了博弈第一阶段的贡献量。这样的惩罚似乎是促成合作、增进群体利益的一个有效机制。但是人们实施惩罚的事实首先就是令人惊讶的。以私人代价惩罚他人的行为，本身就是对集体利益的贡献，所以它是一个劣势策略；如果它以后成功地引导欺骗者采取了更好的行为，这将对整个集体有利，而惩罚者将只得到该利益中属于他的一小部分。所以，惩罚不是自私估计的结果。情况的确如此。在关于该博弈的实验进行的同时，参与者的大脑接受了正电子放射扫描仪的扫描。[5]结果表明，实施惩罚的行为会刺激某个大脑区域，该区域被称为背侧纹状体，它与体验快乐或满足有关。换句话说，人们从惩戒社会欺骗者的行为中，实际上得到了心理上的受益或满足。这种本能必定有着很深的生物根源，而且可能是因为其进化优势而被选择出来的。[6]