“囚徒困境”的深刻哲理

书评人:郑伟强 2007-11-21 12:51 赞[0] 收藏

　　博弈论与信息经济学的产生和发展引发了一场深刻的经济学革命。为了帮助读者掌握这门看似高深的学问，《生活中的博弈论》一书作者在书中用最浅显的语言描述了博弈论与信息经济学的大概思路方法，且采用独立成篇的小文章来讲解这个学科的基本知识，以使普通人也能应用其思想方法来分析甚至解决身边的诸多实际问题。

　　在博弈论中，有一个流传颇为广泛的故事，叫做“囚徒困境”(Prisoner'sDilemma)。

　　话说有一天，一位富翁在家中被杀，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌疑人A和B，并从他们的住处搜出被害人家中丢失的财物。但是，他们都矢口否认曾杀过人，辩称是先发现富翁被杀，然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。

　　这个时候，聪明的警官找他们谈话，分别告诉他们说：“你们的偷盗罪确凿，所以可以判你们2年刑期。但是，我可以和你做个交易。如果你招了，他不招，那么你会作为证人无罪释放，他将被判10年徒刑；如果你招了，他也招了，你们都将被判5年有期徒刑；如果他招了，你不招，他无罪释放，你被判无期徒刑，终身囚禁；如果你们都不招，各判2年。”

　　一般读者可能会误认为，既然两个囚犯最好的结果是都不招供，两人都只被判2年，那么，两个囚犯都选择不招供就是这个博弈的最终结果。

　　然而，人算不如天算，“囚徒困境”之所以称为“困境”正是因为这个博弈的最终结局恰恰是最坏的结果，即两个囚犯统统招供，结果都被判有期徒刑5年。

　　反过来说，这也是警官的聪明之处。警官采取的游戏规则必然会让两名囚犯坦白罪行，认罪服法。对一个博弈来说，游戏规则非常地重要，适宜的规则才能够达到目的。在我们的日常生活中莫不如此，规则制订者往往利用条件制定出有利于自身的规章制度。

　　读到这里，很多读者不禁会问，为什么两个人都选择了“招”，傻到接受这种最坏的结果呢?

　　在解释这个问题之前，笔者首先说明一下，囚徒困境和其他的博弈一样，都需要有2个前提假设：囚徒A和B两人都是自利理性的，即只要给出两种可选的策略，每一方将总是选择其中对他更有利的；两人无法沟通，要在不知道对方所选结果的情况下，独自进行策略选择。

　　囚犯“思想搏斗过程”大致如下，囚犯A的内心活动是这样：假如他招了，我不招，我就要将牢底坐穿；假如他不招，我也不招，只坐2年的牢(因无法串供，风险太大)；如果我招，他不招，马上被释放，也是招了合算。因此，无论囚犯B是坦白还是沉默，囚犯A采取坦白的策略对自己更为有利。同样，以上推理也适用于囚犯B。

　　囚徒困境之所以被称为“困境”，正是在于：如果A、B二人都保持沉默，则都只被判刑2年，显然比两人都坦白的结果要好。

　　两名囚犯都作出招供的选择，这对他们个人来说都是最佳的，即最符合他们个体理性的选择。照博弈论的说法，这是唯一的纳什均衡点。除了这个均衡点，A与B的任何一人单方面改变选择，他只会得到更加不经济的结果。

　　其实“囚徒困境”不允许囚犯A和B进行沟通的假设，与实际生活中大部分情况的现实是有差异的。比如，在爱情博弈中，很多恋人会经常花前月下、彻夜厮守；在企业的价格战中，企业之间也会多有沟通，甚至结成价格联盟；即使是20世纪下半世纪的美苏军备竞赛中，两个超级大国也会经常进行外交交谈，及时交换信息。

　　因此不妨将条件放宽，允许囚犯A和B在审讯室里在一起呆上10分钟，给予他们充分的串供的机会。

　　很明显，双方交流的主旨就是建立攻守同盟，克服自利心理，甚至可能订立一个口头协议，要求双方都不去坦白。然后，双方再单独被提审。

　　我们不妨设想囚犯A的心理活动。他一定会认为，如果囚犯B遵守约定的话，则自己坦白就可获得自由；如果囚犯B告密的话，若自己不坦白就会被终身囚禁。事实上，囚犯A的策略并没有因为简单的沟通或协议而摆脱两难境地。对于囚犯B也是一样。

　　虽然“坦白从宽，抗拒从严”的道理人人都懂，而从博弈论的角度来看，实际上就是一个囚徒困境的应用。“囚徒困境”被看成是博弈论的代表性案例，不仅因为其简单易懂，还在于它的现象在日常生活中广泛存在。

该书评还未归类，请点击这里为其选择合适的分类。