博弈论—胆小鬼博弈和囚徒困境博弈

标签:
教育博弈论胆小鬼博弈囚徒困境博弈 |
分类: 培训和学习心得 |
学习感悟:厦大之行听了张苾芜教授的讲座《中国和平崛起的理论和实践》,记忆特别深刻的是张教授那富有激情的讲授,枯燥的政治理论用丰富的肢体语言,夸张的行为,生动的事例,变得通俗易懂,时而用流利的英语,幽默风趣,让我大开眼界,也深刻地认识到了国际关系处理的一些技巧。特别是张教授讲到了两个外交模式,即威慑模式和螺旋模式,分别是类似于胆小鬼博弈和囚徒困境博弈。
其实,用博弈论可以解决一些社会问题,包括两个国家之间的纷争,如这次的南海仲裁事件。用博弈论知识也可以帮助我理解两国之间关系的一些学问。
一、胆小鬼博弈
假设这样一种情形:两名赛车手各自驾驶汽车沿着一条划定的直线相向而行,相撞前首先转向的一方就是“胆小鬼”,英语中常用 chicken 来形容胆小的人,所以这个假想游戏也被称为 chicken game。此外,现实中的劳资谈判问题也可以看做是胆小鬼博弈——双方都不妥协必然就会两败俱伤,一方妥协往往意味着重大让步。
在胆小鬼博弈中,我们假定双方可以采取的策略只有 2 种:死磕到底(用Dare或D表示)或者认怂(用Chicken或C表示),双方(甲、乙)采取不同策略的收益可以用下表来表示:
这里数字的绝对值并不十分重要,主要是用来表示双方损失或收益的的相对大小。通常一个结果可以用(D,C)这样的形式来表示,即甲方死磕到底,乙方最终认怂。
认怂固然丢面子,但相比玉石俱焚的结果来说,保命显然更重要。因此对一个足够理性的人来说,应该在他能够控制的最后时刻选择C策略,即果断认怂。而如果甲方相信乙方是一个足够理性的人的话,那他应该能够预料到乙方会在最后时刻放弃,所以甲方的最佳策略是死磕到底(D策略),对应的结果就是(D,C),类似的情况反转过来是(C,D)。当然要是双方都这么想的话,最后的结果很可能是(D,D)。
有趣的是,在胆小鬼博弈中当一方的选择受到了限制时,其赢面可能会变大。例如,在赛车的虚拟游戏中,甲方的方向盘被锁死,不得不选择 D 的话,乙方再傻也会知道识时务者为俊杰,选择 C 的结果 -1要远好于同归于尽的 -10。
通常,(C,D)和 (D,C)被称为胆小鬼博弈的纳什均衡点,即在这个状态下,如果一方不改变其策略,不论对方采取什么策略都不会有更大收益。例如,对于(D,C)而言,甲方心意已决,就算乙方将对策由认怂改为死磕,结果也是两败俱伤而不会收益更高。类似的,如果乙方已经决定认怂,甲方不再死磕也选认怂的话,其收益将从
+1 变为
0。
二、囚徒困境博弈
一个经典的囚徒困境描述如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下选择:认罪并作证检控对方(相关术语称“背叛”对方)或是保持沉默(相关术语称“合作”)。
若一人选择背叛,而对方选合作,则此人将即时获释,合作者将判监10年。
若二人都选合作,则二人同样判监半年。若二人都互相背叛,则二人同样判监2年。
我们可以用一张表格来表述: