囚徒困境:信息不足,决策就会迷惘
信息不足,“囚徒”陷入理性的迷宫
在某城市郊区有个足球场,有一次足球场举行一个重要的比赛,大家都想去看。到足球场有好几条路,其中有一条是最近的。王波选择了走最近的这条路,但发现其他人也都选择走这条路,于是这条路非常堵塞。因此在路上所花的时间远远多于自己的预期。好不容易来到了足球场,精彩的比赛让人大开眼界,可惜前排有人站起来,影响了自己的观看效果。王波也选择站起来,这样他能看得清晰一些,他后排的人也只好选择站起来看。最后的结果是所有人都在站着看比赛。
王波无疑是个理性人,但是大家都是理性人的时候,却没有出现理性的结局。从个体来看,他所做出的选择或决策无疑是理性的,但人人都基于同样的考虑做出相同的选择或决策时,就会发生“理性合成谬误”。
1950年,担任斯坦福大学客座教授的数学家图克,为了更形象地说明个体理性,用2个犯罪嫌疑人的故事构造了一个博弈模型,即囚徒困境模型。
警方在一宗盗窃杀人案的侦破过程中,抓到两个犯罪嫌疑人。但是,他们都矢口否认曾杀过人,辩称是先发现富翁被杀,然后顺手牵羊偷了点东西。警察缺乏足够的证据指证他们所犯下的罪行,如果罪犯中至少一人供认罪行,就能确认罪名成立。
于是警方将两人隔离,以防止他们串供或结成攻守同盟,分别跟他们讲清了他们的处境和面临的选择如果他们两人中有一人认罪,则坦白者会被立即释放而另一人将判8年徒刑;如果两人都坦白认罪,他们将被各判5年监禁;若两人都拒不认罪,因警察手上缺乏证据,他们会被处以较轻的偷盗罪各判1年徒刑。
那么,两个罪犯会怎样选择?
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择,也不相信对方不会背叛自己。
那么在困境中任何一名理性囚徒都会作出如此选择:
若对方选择抵赖,自己选择背叛,会让自己获释,所以会选择背叛。
若对方选择背叛,自己也要背叛,才能得到较低的刑期,所以还是选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的均衡,就是双方都背叛对方,结果二人都服刑5年。这就是博弈论中经典的囚徒困境,可用下表表示。
囚徒困境是博弈论的非零和博弈中具有代表性的例子,反映个人最佳选择并非团体最佳选择。虽然囚徒困境本身属于模型性质,但现实中的价格竞争、环境保护等方面,频繁出现类似情况。
囚徒困境假定每个参与者都是利己的,即都寻求最大的自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己的意愿选择策略。
以全体利益而言,如果两个参与者都合作保持沉默,两人都是判刑1年,总体利益更高,结果也比两人都背叛对方、判刑5年的情况好。但根据以上假设,两人均为理性个人,且只追求个人利益,均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作严重,总体利益较合作为低。这就是困境所在。
囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益,但在信息不明的情况下,出卖同伙可为自己带来利益,但是却违反了最佳共同利益。
这种困境反映了个人理性与集体理性之间的矛盾,对每个人而言都是理性的选择,能得到最优的结果,但对于整个集体来说却是非理性的,最终导致对集体中每个人都不利的结果。
每个人想到的都首先是自己的利益,进行的都是有利于自己的选择决策,但最后的结果是大家都没有从中获得好处。以一个足球队而言,当球员在赛场所想的只是自己的风采,或是自己的位置,或者是在俱乐部的前途的时候,这支球队就不会有希望了。
为避免出现“囚徒困境”,任何一个集体都应该加强内部沟通,避免出现信息不对称。只有这样,才能实现集体和内部成员利益的最大化。
增产困境:农业增产不增收
广西南宁市西乡塘区的坛洛镇,是广西香蕉的主产地之一,有着中国香蕉之乡的美称。由于天气转暖,村民们纷纷将自家种植的香蕉运往镇里的香蕉交易市场,寻找买家。
“你这个是收购的?”
“是的。”
“多少钱一串?”
“7元钱。”
“这一串大概有多少斤?”
“大概有60多斤。”
“相当于多少钱一斤?”
“一角多。”
香蕉进入成熟期以后,收获和卖出的时间很短,一旦卖不出去,香蕉的外皮爆裂以后,就无法销售了。他们现在低价收购的大量香蕉都是进入成熟期蕉农没有卖得出去的香蕉。
已经进入成熟期的香蕉价格低得惊人,处在最佳销售期的香蕉在2008年一般每斤的价格在8角钱左右,现在只能卖4角,扣除中间人每斤2分钱的提成,蕉农真正卖出的价格只有3角8分钱。
卢校珠是南宁西乡塘区坛洛镇的香蕉种植户,2008年因为香蕉的价格好,夫妇俩拿出全部家当投入8万多元,种植了30多亩的香蕉。由于投入的增加以及有着多年的香蕉种植经验,2009年家里的香蕉喜获丰收。往年(每棵树)30~40斤一串,现在(每棵树)60~70斤一串,差不多增产一半。
为了使香蕉能够在收割的时节快速从田里运出,卖个好价钱,卢校珠夫妇不久前还专门花费了3.4万元,买了辆小货车。因为他们对于2009年的收入有着更多的期盼。30多亩(香蕉),大概估计能赚个8~10万元左右。
正当卢校珠夫妻俩沉浸在丰收的喜悦中时,2009年9月,卢校珠从稀少的香蕉收购商的数量上,看到了2009年香蕉行情出现的危机。
“价格低是对我们最大的打击,辛苦多少年,投资都投下去了,现在都收不回来,打击这样大,承受不了。”
在卢校珠种植的香蕉园里,已经成熟的香蕉成片地倒在地里,因为没有经销商来收购,地上的香蕉已经没人打理。
“(这片地)等于放弃了,早就放弃了,都没心情管了,心情不好怎么管。”对于2009年种植香蕉出现的这种行情,卢校珠夫妇显得非常痛心,也非常地无奈。“心里很难受,香蕉卖不出去,2009年都亏本了,明年就没有投资了。”
卢校珠夫妇算了一笔账,一亩地种植香蕉120株,他们租地花费了750元,树苗84元,肥料1360元,水电农药费用240元,防寒袋、绳索120元,也就是说种植一亩香蕉的成本一般在2500多元左右,但因为香蕉价格过低,卢校珠一家2009年预计要亏损7万多元。
广西2009年香蕉大丰收,但蕉农们非但没增收,反倒损失惨重。因为数十万吨的香蕉卖不出去,价格跌到了地板价,甚至只能眼睁睁看着香蕉烂在地里。这样的情形的确很反常。
“谷贱伤农”是囚徒困境的一个经典问题,在丰收的年份,农民的收入反而减少了。当粮食大幅增产后,农民为了卖掉手中的粮食,只能竞相降价。由于粮食需求缺少弹性,只有在农民大幅降低粮价后才能将手中的粮食卖出,这就意味着,在粮食丰收时往往粮价要大幅下跌。如果出现粮价下跌的百分比超过粮食增产的百分比,就会出现增产不增收甚至减收的状况。所以一些聪明的农民在博弈时,往往会选择人无我有,人有我优,人优我转的策略。