《囚徒·优势·收益矩阵》_一分为三研究院

http://blog.sina.com.cn/u/5833518891

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

《囚徒·优势·收益矩阵》

(2018-05-20 15:52:08)

标签：

健康

教育

历史

文化

杂谈

http://s3/small/006mMQKngy6YSSi9sCC62690

《囚徒·优势·收益矩阵》

“博弈”中，甲方采取行动时，要考虑乙方或其他人可能会有什么对策或行动。因为每个参与者都会理性采取对自己最优化策略反应。

“囚徒困境”模式，是1905年出生于加拿大、1929年到美国普林斯顿大学做研究工作、后来成为该校数学系主任的阿尔伯特·塔克（Albert Tucker,1905--1995），于1950年，他作为美国斯坦福大学客座教授给心理学家们演讲“博弈论”时，把复杂的“数学演算”手段，变为形象简单的“囚徒困境模式”，创造了“囚徒困境”理论和实例，为“博弈论”和“数学优化”领域做出贡献。

后来被1921年出生于美国的托马斯·谢林（Thomas C Schelling）提出用“收益矩阵”的形式直观地表示参与者在博弈中的得失。

简单说，即甲乙二人携带枪支偷窃当场被抓，分别关押审问。每人必须选择“是否供认并指证同伙”。

于是出现“囚徒困境”的“博弈”局面：

如果二犯都不供认，只会被控非法携带武器，入狱1年。

如果二犯都供认并指证同伙，每人将入狱10年。

如果一人供认，一人不供认，则供认并指证者会因与警方合作而无罪释放，同伙将被严惩入狱20年。

因为事前二人都不能确定对方是否会如何“博弈”行事，所以最“理性、优势”的选择就是“实事求是”选择“认罪”入狱10年，都不敢为了入狱1年而冒险不认罪，可能入狱20年！

（2018-5-14日凌晨于伦敦）、（半千文239）、500字

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：《博弈·零和·非零和》

后一篇：《聪明·傻瓜·误一生》

新浪BLOG意见反馈留言板　欢迎批评指正