如何打破囚徒困境
“囚徒困境”的不合作策略是基于个人理性的,博弈的一次性是它的前提条件。要打破“囚徒困境”,首先,需要保证博弈以重复博弈作为条件;其次,博弈的双方要从集体理性的角度来看待博弈。
在“囚徒困境”中表现最好的策略直接取决于对方采取的策略,特别是取决于这个策略为发展双方合作留出多大的余地。这个原则的基础是下一步相对于当前一步的权重足够大,即未来是重要的。这是“一报还一报”的一个伟大胜利。
区分规则好坏的一个特征是,看它们如何迅速地和可靠地对来自对方的挑战做出反应。一个规则可以被称为“报复性的”,如果它在对方的背叛之后立即以背叛报复。
为了验证面对“囚徒困境”时人们可选择的策略以及这些策略的有效程度,美国的学者组织了一次以此为主题的计算机竞赛。竞赛要求参加者根据这一困境设计程序,并将程序输入计算机,通过各种程序的相互对局的最后得分评判优劣。
竞赛的游戏方法是游戏双方都在不知对方将如何选择的情况下,选择合作或背叛。这些选择放在一起就产生了四个可能的结果,即合作,合作;合作,背叛;背叛,合作;背叛,背叛。在这个游戏中,如果双方选择合作,双方都能得到较好的结果R,即“对双方合作的奖励”。在这个例子中R为3分,3分也可以代表参赛者得到的奖金数。如果一方合作而另一方背叛,那么,背叛者得到“对背叛的诱惑”T=5,而合作者则得到“给笨蛋的报酬”S=0。如果双方都背叛那么双方都得到P=1,即“对双方背叛的惩罚”。
在比赛中,有好几个规则故意使用若干次背叛,试试看它们能否讨到便宜。因此,很大程度上决定规则的最后名次的是它们能否很好地应付这些挑战。对付这类挑战性规则的最好办法是时刻准备报复来自对方“无缘无故”的背叛。因此,善良能得到好处,报复也能得到好处。“一报还一报”综合了这些优点,它是善良的、宽容的和具报复性的。它从不首先背叛,但是不管过去相处的关系如何好,它总能被一个背叛所激怒,而迅速做出反应。
生态分析的结果说明了“一报还一报”的又一个胜利。在最初的竞赛中“一报还一报”领先一点点,而且在整个生态模拟过程中一直保持领先,到了第1000代,它是最成功的规则,并且比其他任何一个规则都增长得快。
“一报还一报”的所有记录是令人难忘的。概括地说,“一报还一报”是62个参赛者中平均得分最高的规则。在竞赛的生态模拟中它一直保持领先,加上它在实验室的对策实验中的良好表现,“一报还一报”显然是一个非常成功的策略。
“一报还一报”的成功可以说明它是一个很具适应性的规则,即它在很大范围的环境中表现极佳。它的成功部分是由于其他规则预料到它的存在,并且被设计得与它很好相处。要和“一报还一报”很好相处就要和它合作,这反过来就帮助了“一报还一报”。即使那些被设计成伺机占便宜而不被惩罚的规则,也很快向“一报还一报”道歉。任何想占“一报还一报”便宜的规则最终将伤害自己。“一报还一报”从自己的不可欺负性得到好处,是因为以下三个条件得到了满足:
1.遇到“一报还一报”的可能性是显著的。
2.一旦相遇,“一报还一报”很容易被识别出来。
3.一旦被识别出来,其不可欺负性就显示出来。
因此,一方面“一报还一报”从它自己的清晰性中得到好处。另一方面,“一报还一报”放弃了占他人便宜的机会。这种机会有时是很有利可图的,但是试图占便宜而引来的问题也多种多样。首先,如果一个规则用背叛试探是否可以占便宜,它就得冒被那些可激怒的规则报复的风险。其次,双方的反击一旦开始,就很难自己解脱。
“一报还一报”的稳定成功的原因是它综合了善良性、报复性、宽容性和清晰性。它的善良性防止它陷入不必要的麻烦,它的报复性使对方试着背叛一次后就不敢再背叛,它的宽容性有助于重新恢复合作,它的清晰性使它容易被对方理解,从而引出长期的合作。“一报还一报”能够赢得竞赛不是靠打击对方,而是靠从对方引出使双方都有好处的行为。
上述“囚徒困境”说的都是一次性博弈,一锤子买卖。如果是多次博弈,人们就有了合作的可能性,“囚徒困境”就有可能被破解。其中道理可以这样理解:火车站边卖的东西质量差,因为顾客多是一次性的过路人;小区里小店质量、服务可能不错,因为它们靠的是回头客。店主都是为自己的利益考虑,但结果对大家都有利。所以说,连续的合作有可能成为重复的“囚徒困境”的均衡解,这也是博弈论上著名的“大众定理”的含义。
行业自律或者同盟可以产生脱离“囚徒困境”的“合作均衡”的情况,不仅仅局限在某一行业、某一国内市场上。各个国家,尤其是发达国家,为了促进本国出口部门的发展,会对出口企业给予补贴,最常见的做法就是出口退税和以优惠利率提供贷款。一旦外国采取了这种做法,那么本国就得采取相应的举措。倘若不加以自律,那么结果可想而知,为了抢占市场份额,各个国家的出口企业既然得到国家财力上的支持,就会以低于成本的价格倾销,从而会扰乱全球的市场秩序和资源配置。为了求得合作,世界贸易组织的相关法律中对出口税收补贴加以规定,并有强制性的惩罚措施,而经济合作发展组织则对各国的出口补贴贷款规定了最低利率限制。另外一个众所周知的组织——石油输出国组织,其主要功能之一就是限制原油产量,从而部分保证石油价格的稳定,也就是实现各产油国之间的“合作均衡”。
“囚徒困境”并不难理解,只要所有的参与者把眼光放得长远些,积极参与行业自律,那么“共赢”局面是可以出现的。而且,对于主动倡导行业规则制定的参与者来说,还会得到额外的益处和主动权。
温州是中国经济发展速度最快的地区之一,这与温州中小企业如水一般共生共荣的“合作均衡”是分不开的,经济学者将温州企业的合作共赢状态称为“温州企业生态模式”。譬如,温州一些生产打火机的厂家打败了美国和欧洲打火机制造商就是一个极好的例子,它是500家企业联合起来做打火机,每个企业都不大,我做个弹簧,你做个外壳,我们加起来做成一个打火机。之所以能够击败全世界的打火机制造商,是因为它们联起手来做。它们共同遵守约定的商业规则,互相之间是买卖关系,通过市场交易进行组装。这些温州企业之所以能够聚合集体的力量,享受到合意的商业生态环境带来的益处,很大程度上有赖于它们处在合作的“均衡解”上。
如果温州企业陷入“囚徒困境”会怎么样?
假设做弹簧的企业或者做外壳的企业,看到联手制造出的打火机已然创造了丰厚利润,进而打破合作局面,提高自己所生产部件的价格,那么联合制造出的打火机必然会价格上升,从而断送掉竞争优势。或者,假设某一企业规模已经足够大了,认为完全由自己生产打火机配件进行组装的利润空间更大,那么这样做的结果一方面可能会影响到打火机的质量,另一方面必然会触发整个联合企业链的争夺,打火机的价格会不断下降,最后大家都没有利润,进而可能会断送掉大家辛辛苦苦争得的优势地位。所以,避免陷入“囚徒困境”,保持“合作均衡”的状态,遵守合作规则,能够为大家带来更为长久的利益。