囚徒困境

标签:
囚徒困境杂谈 |
分类: 有趣故事 |
讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种博弈的结果:
- A和B均坦白
- 均不坦白
- A坦白B不坦白
- B坦白A不坦白。
A和B均坦白是这个博弈的纳什均衡。这是因为:
- 假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判10年;
- 假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。
即是说,不管A坦白或抵赖,B的最佳选择都是坦白。
反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。
结果,两个人都选择了坦白,各判刑8年。
在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。
后一篇:高中阅读《狼》