博弈兴奋剂:运动员的“囚徒困境”

标签:
身边的奥运兴奋剂囚徒困境禁药莱蒙德美国环球科学科学美国人杂谈 |
分类: 文章选登 |
撰文 迈克尔·舍默(Michael Shermer)
翻译 郭凯声
http://www.sciam.cn/showimg.php?iid=3687
作为一名自行车赛车选手,最让你感到屈辱和挫败的,莫过于在一段上坡路奋力骑行时被对手无情地甩下。尽管已经上气不接下气、两腿酸软,但你还是要咬紧牙关,拼尽全力跟上领先的车手。因为你非常清楚,一旦被甩出第一集团,就会失去继续拼搏下去的全部动力,赢得比赛的希望也就化为乌有。
对此,我有亲身体验。1985 年,我参加了不间断横跨美国的自行车大赛,赛程长达 4,800 千米。比赛进行到阿尔布刻尔克郊外一段漫长的上坡时,我已经赶上了乔纳森·博耶尔(Jonathan Boyer),这位健硕的公路自行车赛选手当时位居第二,并最终获得了冠军,他也是首位参加环法自行车赛的美国人。但这段上坡路实在太漫长了,刚爬到一半,我便感觉疲惫不堪,双腿也好像快断掉了。我只得大口喘气,竭尽全力苦苦支撑。
但一切都是徒劳。快接近山顶时,博耶尔早已消失在沥青公路尽头。望尘莫及的我直到大西洋城的比赛终点才再次见到他。那天晚上,美国广播公司(ABC)体育解说员吉姆·兰普利(Jim Lampley)问我,还有什么方法,可以让骑行速度更快?“我想,有个好爹妈或许最管用,”我冷冷地回答。所有人都受遗传因素限制,很难突破自己的极限——认命吧,不然你还能怎样?
然而我很清楚,可以做手脚的地方非常多。1984 年洛杉矶奥运会期间,美国自行车队选手告诉我,他们曾在比赛前给自己输血,有的是输入他们自己在赛季之初抽出来的血,有的则是输入其他血型相同人的血。这种做法被称为“血液回输”(blood doping),在当时并不算违规。从实际情况来看,血液回输与在高海拔地区训练的效果相当:都可以增加选手体内红血球的数量,提高携氧能力。不过,当时我已年届三十,当不了车手,还可以做学术。我参加自行车比赛,主要是想了解自己的体能极限。为了成绩而弄虚作假,就与我参赛的本意南辕北辙了。
但是,我们不妨假设:如果当时我只有20 岁,全凭赛车这个职业糊口;如果我所在车队已经把禁药纳入“保健方案”,而且我明白,竞争力不够就只能卷铺盖走人;此外,我相信大部分竞争对手都在服用兴奋剂,并没有谁被查出来。我会做出怎样的选择?
许多自行车手声称,上面假设的种种情况,正是他们自20 世纪90 年代初以来一直面临的局面。同样的情况也出现在棒球等其他体育项目中,虽然细节有所差别,但滥用兴奋剂的总趋势却如出一辙。许多选手认为,别人都在服药,如果自己还坚持独善其身,将无法与对手竞争。再看看监管层,美国职业棒球大联盟从未制定明确的规则,更谈不上在整个赛季中进行广泛的药检,再加上他们长期以来都有意回避兴奋剂这个问题,终于造成了如今的局面。
我们都不愿意相信,这些体育明星在偷服禁药。但面对越来越多的证据,我不得不承认:不论是自行车,还是棒球、足球、田径等体育项目,过去20 年中的绝大部分顶尖选手一直在服用兴奋剂。现在我们应该追问兴奋剂泛滥的原因,而不是“有没有服兴奋剂”:首先,药物、药物混合法以及药物训练养生法在不断进步;其次,在药检执法者与偷吃禁药者的博弈中,执法者老是处于下风;第三,众多职业体育项目中,服药者总能获得胜利,助长了兴奋剂的流行。
体育中的博弈论
利用博弈论中著名的“囚徒困境”,来揭示体育界愈演愈烈的兴奋剂问题,也许可以给我们很多新的启示。
对局者在预知对手策略的情况下如何应对,以达到最佳结果, 这就是博弈论(Games Theory) 研究的内容。这一理论所针对的“对局”,不仅仅是指扑克游戏或侧重于战术策略的各种体育比赛,还包括需要作出经济、军事决策乃至国家外交政策的各种极其严肃的活动。所有这些“对局”都有一个共同点,就是对局者会依据公开的选项范围,分析对手的每一“步”行动。
著名的“囚徒困境”就是博弈论的一个经典实例:你和同伙落入法网,被分开关押,无法串供。你们事先约定,大家都打死不招,然而地方检察官给出了下面几个选择:
1. 如果你坦白交待而同伙拒不认罪,那么你将被释放,而他将蹲三年监狱;
2. 如果他坦白交待而你拒不认罪,那就轮到你蹲三年大牢,而他获得自由;
3. 如果两人都坦白,每人各处两年有期徒刑;
4. 如果两人都不认罪,每人各处一年有期徒刑。
上表名为“博弈矩阵”,概括了上述四种结果。
从这些结果来分析,背叛同伴似乎是你的最佳选择。我们先从罪犯甲的角度来考虑,他唯一无法控制、又能影响结果的因素就是罪犯乙的选择。假定罪犯乙始终保持沉默,那么,罪犯甲坦白交代结果最佳,可以躲过牢狱之灾;如果他选择保持沉默,结果也还不错,只要蹲一年大牢。因此,对于罪犯甲来说,最好的选择就是坦白。现在,我们假设罪犯乙认罪。在这种情况下,对罪犯甲而言,情况依然是坦白交待胜过拒不认罪——坦白会让他被判两年监禁,否则迎接他的将是三年铁窗生涯。由于两名罪犯面临的情势完全相同,因此无论对方如何选择,对另一个罪犯来说,最好的办法都是坦白。
这不仅仅是理论上的结果,也得到了实验的证实。当参与“囚徒困境”博弈的受试者彼此间不允许通气时,只玩一次或固定次数的对局,他们常用的策略就是坦白交待。如果受试者玩次数不定的对局,那么最常用的策略便是“针锋相对”:开始时,受试者都会遵守约定保持沉默,但随后就会根据对方的表现来决定自己的选择:你义气我也义气,你不仁我也不义。多人囚徒困境的对局中,如果局中人玩的次数增多,彼此间形成信任,则可能出现更加合作的模式。不过研究表明,一旦大家都争相坦白而导致背叛成风,就会出现多米诺骨牌式的崩盘局面。
在自行车、棒球和其他一些体育项目中,参赛者按照一组规则彼此竞争。自行车竞赛规则明文禁止使用兴奋剂。但这类药物极其有效,服用以后又很难检测出来(尽管还是有可能),再加上成功之后名利双收,使运动员们无法抗拒禁药的诱惑。一旦几位车手依靠兴奋剂获得佳绩,其他遵规守纪的选手也必定效仿,导致违规之风愈演愈烈。由于违规将导致重罚, 车手们全都对此保持沉默。因此,通过公开协商来扭转这种局面、使比赛回到正轨的想法,是不现实的。
以前的情况并非如此。20 世纪40 年代到80 年代,许多车手都服用兴奋剂和镇痛药。直到1967 年环法自行车赛中,英国车手汤姆· 辛普森(Tom Simpson) 因过量服用安非他明而在旺图山赛段爬坡时猝死,兴奋剂禁令才随之出台。即便在辛普森的悲剧之后, 整个70 年代和80 年代,反兴奋剂条例的执行也时紧时松。由于对服用禁药没有明确的规定,很少有人把使用兴奋剂视为作弊行为。但随着90 年代出现的一个新生事物,博弈矩阵被改变了。
http://news.xinhuanet.com/tech/2008-08/07/xinsrc_5620805071453375211336.jpg