加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

博弈论—胆小鬼博弈和囚徒困境博弈

(2016-07-21 09:16:18)
标签:

教育

博弈论

胆小鬼博弈

囚徒困境博弈

分类: 培训和学习心得

博弈论—胆小鬼博弈和囚徒困境博弈

学习感悟:厦大之行听了张苾芜教授的讲座《中国和平崛起的理论和实践》,记忆特别深刻的是张教授那富有激情的讲授,枯燥的政治理论用丰富的肢体语言,夸张的行为,生动的事例,变得通俗易懂,时而用流利的英语,幽默风趣,让我大开眼界,也深刻地认识到了国际关系处理的一些技巧。特别是张教授讲到了两个外交模式,即威慑模式和螺旋模式,分别是类似于胆小鬼博弈和囚徒困境博弈。

其实,用博弈论可以解决一些社会问题,包括两个国家之间的纷争,如这次的南海仲裁事件。用博弈论知识也可以帮助我理解两国之间关系的一些学问。

一、胆小鬼博弈

假设这样一种情形:两名赛车手各自驾驶汽车沿着一条划定的直线相向而行,相撞前首先转向的一方就是胆小鬼,英语中常用 chicken 来形容胆小的人,所以这个假想游戏也被称为 chicken game。此外,现实中的劳资谈判问题也可以看做是胆小鬼博弈——双方都不妥协必然就会两败俱伤,一方妥协往往意味着重大让步。

在胆小鬼博弈中,我们假定双方可以采取的策略只有 2 种:死磕到底(用DareD表示)或者认怂(用ChickenC表示),双方(甲、乙)采取不同策略的收益可以用下表来表示:

博弈论—胆小鬼博弈和囚徒困境博弈  

这里数字的绝对值并不十分重要,主要是用来表示双方损失或收益的的相对大小。通常一个结果可以用(DC)这样的形式来表示,即甲方死磕到底,乙方最终认怂。

认怂固然丢面子,但相比玉石俱焚的结果来说,保命显然更重要。因此对一个足够理性的人来说,应该在他能够控制的最后时刻选择C策略,即果断认怂。而如果甲方相信乙方是一个足够理性的人的话,那他应该能够预料到乙方会在最后时刻放弃,所以甲方的最佳策略是死磕到底(D策略),对应的结果就是(DC),类似的情况反转过来是(CD)。当然要是双方都这么想的话,最后的结果很可能是(DD)。

有趣的是,在胆小鬼博弈中当一方的选择受到了限制时,其赢面可能会变大。例如,在赛车的虚拟游戏中,甲方的方向盘被锁死,不得不选择 D 的话,乙方再傻也会知道识时务者为俊杰,选择 C 的结果 -1要远好于同归于尽的 -10

通常,(CD)和 (DC)被称为胆小鬼博弈的纳什均衡点,即在这个状态下,如果一方不改变其策略,不论对方采取什么策略都不会有更大收益。例如,对于(DC)而言,甲方心意已决,就算乙方将对策由认怂改为死磕,结果也是两败俱伤而不会收益更高。类似的,如果乙方已经决定认怂,甲方不再死磕也选认怂的话,其收益将从 +1 变为 0

二、囚徒困境博弈

一个经典的囚徒困境描述如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下选择:认罪并作证检控对方(相关术语称背叛对方)或是保持沉默(相关术语称合作)。

若一人选择背叛,而对方选合作,则此人将即时获释,合作者将判监10年。

若二人都选合作,则二人同样判监半年。若二人都互相背叛,则二人同样判监2年。

我们可以用一张表格来表述:

博弈论—胆小鬼博弈和囚徒困境博弈  

        如果你是其中之一,只考虑尽量使自己服刑年份最小化的话,你会怎么选?我相信大部分的人会选择背叛,确实有太多理由让人选择背叛了,比如有人坚信对方会背叛你,而你不愿意选择合作而服刑10年,所以你选择背叛而服刑2年。他的理由对他来说已经很充分了,但是我们还需要考虑另一种情况,就是乙坚信甲不会背叛他,那么乙应该选择什么?乙还是应该选择背叛,因为乙选择背叛就能立即获释,而乙选择合作还需要服刑半年。在这种情况下,无论甲作何选择,对乙来说选择背叛总是优于选择合作,那么我们称背叛是乙的优势策略。无论是实验的事实还是简单的分析,都告诉我们背叛是每个人的最佳选择。所以最终两个人都会选择背叛,而同服刑2年,这就是囚徒困境的结果。

0

阅读 收藏 喜欢 打印举报/Report
前一篇:养生之道
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有