纳什的“囚徒困境”

标签:
纳什囚徒困境诺贝尔经济学奖奥斯卡金像奖 |
分类: 数学探幽 |
http://s2/mw690/0027mk9Hgy6TW7QXHSp61&690
约翰·福布斯·纳什(John
“囚徒困境”是非合作博弈的经典例子。警方拘押了甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是,将二人分开囚禁、审讯,并向双方提供相同的选择:若认罪并作证检举对方,而对方保持沉默,则认罪者获释、沉默者判监10年;若二人都保持沉默,则二人同判监半年;若二人互相检举,则二人同判监2年。
囚徒们面临着两难的选择——坦白或抵赖。尽管若双方都抵赖,结果都只被判半年,显然最有利。但因二囚徒遭隔离无法串供,从利己的目的出发,选择坦白交代才是最佳策略。自己坦白,显然要比同伙坦白、自己抵赖要好,所以,二囚徒合理的选择是坦白。原本对双方最为有利的策略(抵赖)和结局(被判半年刑)不会出现。这种“都选择背叛对方而坦白的策略、因此被判2年的结局”,被称为“纳什均衡”,也叫非合作均衡。
显而易见,这在现实司法上是荒谬的,但囚徒的两难选择有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致所有参与者都不利的最终结局,是一个“纳什均衡”。例如家电市场的价格与销量、国际贸易中的贸易自由与实行贸易保护主义壁垒。
亚当·斯密在《国富论》中有句名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但从“纳什均衡”却引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,两个囚徒的命运就是如此。
从“纳什均衡”中可以悟出的最具价值的真理,即:合作是有利的“利己策略”,只有彼此合作,参与各方才有利益最大化的可能。同一蓝天下,不国的国度、不同的肤色和种族、不同的地域和人群,都不要企图将利益独占,最后,迫使弱势一方强烈仇视强势一方,最终没有一个能够幸运,包括规则的制定者们。6月15日以来的A股市场,千股跌停、千股涨停频频,将贪婪无知的融资客吃净了肉甚至连一根骨头都不留下,但最终出现了国家不得不强力救市的危局。
非合作博弈中,双方均得不到最大的好处,这是“困境”之所在。但在现实生活中,非合作的情况往往比合作的情况更普遍。因为,合作也有原则,即按照你愿意别人对你的方式来对别人,但只有别人也按同样方式行事才行。“己所不欲、勿施于人”,但前提是“人所不欲、勿施于我”,这就陷入了另一种“困境”。于是,在互惠互利的基础上谈判、签约,必然成为合作共赢的有效方式,而一味我行我素,甚至炫耀武力,必然有悖于世界潮流。
作为博弈论创始人的纳什,成了获得奥斯卡金像奖的《美丽心灵》男主角原型,就因为纳什的人生,与其说是富有戏剧性,倒不如说是悲剧。“纳什均衡”是他21岁博士毕业的论文,奠定了数十年后获得诺贝尔经济学奖的基础。30岁,取得麻省理工学院的终身职位,妻子怀孕,后来儿子出生,他却因为幻听幻觉被确诊为严重的精神分裂症,然后是接二连三的诊治,短暂的恢复和新的复发。1960年夏天,他蓬头垢面,长发披肩,目光呆滞,胡子犹如丛生的杂草,在普林斯顿的街头上光着脚丫子晃晃悠悠。直到1980年代末期,纳什渐渐康复,从疯癫中苏醒。在诺贝尔奖得主自传中,他写道:“从统计学看来,没有任何一个已经66岁的数学家或科学家能通过持续的研究工作,在他或她以前的成就基础上更进一步。但是,我仍然继续努力尝试。由于出现了长达25年部分不真实的思维,相当于提供了某种假期,我的情况可能并不符合常规。因此,我希望通过至1997年的研究成果或以后出现的任何新鲜想法,取得一些有价值的成果。”2015年5月23日,约翰·纳什夫妇遇车祸丧生,终年86岁。
这正是:
利己利他分辨清,一旦成囚难回身。
合作共赢困境解,己所不欲勿施人。