《囚徒·优势·收益矩阵》

标签:
健康教育历史文化杂谈 |
《囚徒·优势·收益矩阵》
“博弈”中,甲方采取行动时,要考虑乙方或其他人可能会有什么对策或行动。因为每个参与者都会理性采取对自己最优化策略反应。
“囚徒困境”模式,是1905年出生于加拿大、1929年到美国普林斯顿大学做研究工作、后来成为该校数学系主任的阿尔伯特·塔克(Albert Tucker,1905--1995),于1950年,他作为美国斯坦福大学客座教授给心理学家们演讲“博弈论”时,把复杂的“数学演算”手段,变为形象简单的“囚徒困境模式”,创造了“囚徒困境”理论和实例,为“博弈论”和“数学优化”领域做出贡献。
后来被1921年出生于美国的托马斯·谢林(Thomas C Schelling)提出用“收益矩阵”的形式直观地表示参与者在博弈中的得失。
简单说,即甲乙二人携带枪支偷窃当场被抓,分别关押审问。每人必须选择“是否供认并指证同伙”。
于是出现“囚徒困境”的“博弈”局面:
如果二犯都不供认,只会被控非法携带武器,入狱1年。
如果二犯都供认并指证同伙,每人将入狱10年。
如果一人供认,一人不供认,则供认并指证者会因与警方合作而无罪释放,同伙将被严惩入狱20年。
因为事前二人都不能确定对方是否会如何“博弈”行事,所以最“理性、优势”的选择就是“实事求是”选择“认罪”入狱10年,都不敢为了入狱1年而冒险不认罪,可能入狱20年!
(2018-5-14日凌晨于伦敦)、(半千文239)、500字