较新的实验

  成千上万的关于囚徒困境的实验是在课堂和实验室进行的,这些实验涉及不同参与者人数、不同重复次数以及其他方面。下面是一些重要发现。[1]

  首先最重要的是,合作发生得相当频繁,即使每对参与者只达成一次合作。平均而言,几乎一半参与者选择了合作。确实,对此最引人注目的例证来自游戏秀网络产品“朋友还是敌人”。在这个节目秀中,两人一组,每组都被问了一些琐碎问题。答对的人赚得的钱存入“信托资金”,在 105 集中,资金总额为 200~16400 美元不等。为了分配这笔资金,参赛者双方进行一个单次囚徒困境博弈。

  每个人私下里写下“朋友”或“敌人”。当双方同时写下朋友时,他们平分这笔资金。如果一方写了敌人而另一方写了朋友,那么,写敌人的那个人将得到全部资金。但若双方都写敌人,他们都将一无所获。不论对方写什么,你写敌人得到的钱至少等于或者可能大于你写朋友所得到的钱。然而,几乎一半参赛者写下的是朋友。甚至当资金总额增大时,合作的可能性也没有改变。资金低于 3000 美元时人们合作的可能性,与资金高于 5000 美元时相等。以上就是从菲利克斯·奥本豪泽尔–吉(Felix Oberholzer-Gee)教授和乔·沃德弗格(Joel Waldfogel)教授,以及马修·怀特(Matthew White)教授和约翰·李斯特(John List)教授所进行的两项研究中发现的一些结果。[2]

  如果你还在疑惑看电视如何算得上是学术研究,可结果已有过 700000 美元的资金分给了参赛者。这是史上奖金最多的囚徒困境实验。我们能从中学到许多东西。实验结果表明,女性比男性更倾向于合作,在第一季,女性和男性合作的概率分别是 47.5% 和 53.7%。第一季的参赛者不具有可以在决策前看到其他比赛结果的优势。但到了第二季,前 40 集的结果已经公布了,这个模式变得显而易见。参赛者可以从其他人的经验中学到一些策略。当某一组是由两个女性组成时,合作的概率增至 55%。但是当一个女性与一个男性组对时,这个女性的合作概率降到了 34.2%。而这个男性的概率也降到了 42.3%。总体而言,合作率降低了 10 个百分点。

  如果一群实验对象集中起来进行几次配对,且每次的配对不同,那么,选择合作的比率一般会随时间下降。不过,它不会降至零,而是总有固定的一小部分人坚持合作。

  如果同一对实验对象重复进行基本的囚徒困境博弈,他们常常逐渐达成连续的相互合作,直到其中一个参与者在临近这一连续重复博弈结束时选择了背叛。在第一次进行的困境实验中就发生了这样的事。弗勒德和德雷希尔一设计出这个博弈,就立即招呼他们的两个同事进行了 100 次这个囚徒困境博弈[3]。其中 60 次双方都选择了合作。较长的一次连续相互合作是从第 83 轮持续到第 98 轮,直到其中一方在第 99 轮偷偷背叛。

  事实上,按照博弈论的严格逻辑,这种情况本来不应该发生。当这个博弈恰好重复 100 次时,它就是一个同时行动博弈序列,我们可以用倒后推理的逻辑来解决这样的博弈。展望一下在第 100 次博弈时会发生什么。因为往后不再有更多的博弈了,所以背叛不可能在以后的任何一轮遭到惩罚。根据优势策略的推理,双方都应该在最后一轮选择背叛。但是,一旦确定了双方都会在最后一轮选择背叛,第 99 轮实际上就成了最后一轮。尽管后面还有一轮,在第 99 轮的背叛也不会在第 100 轮遭到对方的选择性惩罚,因为对方在第 100 轮中的选择是预先注定的。因此,优势策略的逻辑也适用于第 99 轮。我们可以用这个序列逻辑一直倒后推理到第 1 轮。不过,在实际博弈中,不论是在实验室还是在真实世界中,参与者似乎忽略了这个逻辑,结果反而受益于相互合作。事实证明,只要其他人同样都是“非理性”的,那么,乍看上去可能是非理性的行为,偏离参与者的优势策略却是一个正确的选择。

  针对此种现象,博弈论学者做出了一种解释。现实世界中存在一些“互惠主义者”,只要对方合作,他们也愿意合作。假设你并不是这些相对友好的人中的一员。如果你在一个有限次重复囚徒困境博弈中按照自己的风格行事,那么你会从一开始就欺骗。而这会向对方参与者暴露出你的本性。为了掩盖真相(至少掩盖一会儿),你不得不表现出友好的样子。为什么你愿意这么做呢?假设你一开始就表现得友好。那么,即使对方参与者不是一个互惠主义者,他也会认为你可能是周围少有的几个友好的人中的一员。合作一段时间将会带来一些实实在在的好处,于是对方会打算报答你的善举,以获取这些好处。这对你也有好处。当然,你正计划在临近博弈结束时偷偷欺骗,就像对方一样。但你们仍然能够在最初阶段维持一段互利互惠的合作。虽然各方都假装善良等着占对方便宜,但双方都会从这种共同欺骗中获得好处。