昨天发的有关桑普拉斯和费德勒数据比较的一篇博客
让我想到去年编译过的一篇文章
作者使用的量化分析方法本身没有错 但选取的分析项是否科学和有逻辑 则可能会引起争议
重看这篇文章 又想起以前学数量分析研究方法论的日子——
data analysis, hypothesis testing, survey research...
还好,只要和数字有关的 咱中国人学起来就不怕
阅读这篇东西请注意时间限定 东西是去年写的
也不知道表格能不能贴上去 试试...试了下 表格格式太大 对不准看个意思啦
可能比较枯燥吧 不知道这种学术性的文章有没人要看
谁比谁伟大
费德勒上周刚刚夺下了温网三连冠,也再次将这个命题抛给我们:这位下月才将迎来24岁生日的瑞士人,他的职业成就能够超越桑普拉斯吗?他能否最终成为历史上最伟大的男子网球运动员?
上周出版的一期法国队报将24岁前的桑普拉斯与费德勒至今的职业成就做了对比,结果是:两人就像是双胞胎。在24岁前,桑天王和费天王都取得了5个大满贯冠军,大师系列赛事冠军则是费德勒以7对6稍占上风;单打冠军总数,桑普拉斯的32个超过费德勒两个;决赛的胜率,费德勒是79%而桑普拉斯则是74%。很惊讶费德勒的胜率没有更高一些,毕竟他目前掌握着决赛21场连胜的历史纪录。不过,他在职业生涯初期当了太多次亚军,现在也只能辛苦地“还债”。
就像周润发的那则西服广告词那样,费德勒也可以来这么一句:成功?我才刚上路呢!目前,他的大满贯冠军数比桑普拉斯的14个还少9个,简单的计算结果是:如果费德勒能够不受重大伤病困扰地打到30岁,假使他每年能获得1.5个大满贯赛事冠军,他就将铁定超越桑普拉斯这一在几年前还被普遍认为是前无古人后无来者的纪录。
你也许已经发现了,上面的这两段文字里,出现最多的其实是数字。一位球员赛场拼杀十数年,他的职业生涯最终就被几行数字所总结,这确实相当冷酷。不过,网球运动在量化研究上其实是缺乏深厚传统,而作为普通的球迷,他们更倾向于凭借个人的观察而不是精密的数据去考量某位球员的成就。另外,人性的特点注定我们倾向于更看重时代更近的球员,而不是将他们放在历史的坐标中去客观地评定。就比如,我们更愿意将桑普拉斯奉为最伟大,而茫然地问出:罗德·拉沃是哪个家伙?
但是,谁是史上最伟大的男女网球运动员,如此严肃的问题只能通过科学的研究来给出答案。美国的网球历史学者雷蒙德·李将公开赛时代,也就是1968年后的共九位伟大球员做一个统计比较分析,结果令人吃惊:近三十多年来最伟大的网球运动员居然是瑞典球王博格,而很多人心目中的最伟大桑普拉斯,只是远远地排在第五。
这项研究从球员十个方面的表现搜集数据:
1. 职业生涯的总胜率
2. 职业生涯成绩最好的连续五年的胜率
3. 职业冠军数量
4. 最佳连续五年的冠军数量
5. 职业生涯的赛事赢取率
6. 最佳连续五年的赛事赢取率
7. 职业生涯大满贯赛事冠军数量
8. 最佳连续五年的大满贯赛事冠军数量
9. 职业生涯的大满贯赛事胜率
10. 连续五年的大满贯赛事胜率
按照这个标准,博格史上第一的地位绝对毫无置疑,因为他在这十个评判标准中居然有七项都位居第一。博格在1981年的美网赛决赛后告别了网坛,24年的巨大时间间隙很容易让我们淡忘他曾经获得过的那些辉煌成绩。康纳斯成为历史上第二伟大的球员,他109个职业冠军单打数量至今无人打破,并且很可能也将永载史册。1973年,康纳斯取得了也许是男子网球历史上最不可思议的一个赛季,他拿下三个大满贯赛事的冠军,在总共103场比赛中取得了99场胜利,当年的胜率达到了可怕的0.961。
康纳斯 博格 麦肯罗 伦德尔 阿加西 维兰德 埃德博格 贝克尔 桑普拉斯
职业胜率.817(3).855(1).82(2).817(4).765(7).720(9).749(8).769(6).774(5)
五年胜率.908(3).916(1).896(4).910(2).789(9).811(8).820(7).833(5).829
职业冠军数量109(1)73(4)77(3) 94(2) 58(6) 33(9) 41(8) 49(7) 64(5)
五年冠军数量 59(1)55(2)43(3) 41(4) 20(9) 22(8) 25(7) 26(6) 35(5)
职业赛事赢取率
.31(2).48(1) .29(3) .28(4).197(6).129(9).13(8).186(7) .228(5)
五年赛事赢取率
.562(2).655(1).506(4).539(3).212(9).222(8).243(7).302(6).411(5)
职业大满贯数量 8(3) 11(2) 7(4) 8(3) 8(3) 7(4) 7(4) 6(5) 14(1)
五年大满贯数量 5(3) 8(1) 6(2) 6(2) 4(4) 3(5) 4(4) 3(5) 8(1)
职业大满贯胜率
.138(6).407(1).156(4).140(8).154(5).159(3).111(9).130(7).269(2)
五年大满贯胜率
0.417(2).571(1).400(3).400(3).267(4).167(6).200(5).167(6).400(3)
总分及名次26(2) 15(1) 32(3) 35(4) 62(7) 69(9) 68(8) 60(6) 38(5)
注:括号中为该球员在当统计项中的排名,总分为该球员排名数字的总和。
麦肯罗在这项统计中排名第三,虽然他在十项统计中没有一项名列第一,但他也没有在任何一项中跌出过前四。麦肯罗最伟大的赛季出现在1984年,他夺得了所参加的15项赛事中的13个单打冠军,赛季总战绩为82胜3负。
桑普拉斯仅仅排名第五,甚至还排在伦德尔之后。虽然桑普拉斯在和大满贯有关的两项数据中排列第一,但他在职业胜率以及冠军数量上的弱势大大拖了他的后腿。这很有可能和桑普拉斯对于中小型赛事的重视与投入程度不够有关,特别是在他职业生涯的中后期,他更简直就是一切为了大满贯。
这项研究的作者还将同样的统计模式套用在了女子网球选手身上,她得出的结论是,公开赛时代最伟大的球员是纳夫拉蒂诺娃,其次是埃芙特,而格拉夫仅仅位列第三。在这三人之后依次是:塞莱斯、小威廉姆斯、辛吉斯、大威廉姆斯、达文波特和桑切斯。当然,正如作者所指出的那样,这其中的几位现役球员仍然有机会提升自己的位置。
历史学家的主要任务似乎就是两项:考据和争吵,而且他们将这两项活动都进行得无休无止,在冷清中认真地寻找热闹。雷蒙德·李的这项研究发表之后,同样引起了相当广泛的争论,其中比较有说服力的是另一位网球史学家大卫·麦卡锡的观点。麦卡锡认为,雷蒙德·李研究中的最大弱点,是无法解释为何选取“成绩最佳的连续五年”最为研究对象,如此取样,只会对埃芙特和博格这样成绩超级稳定的选手有利,而对阿加西这样成绩大起大落的球员十分不公平。麦卡锡在自己的研究中稍微变动了一下评定标准,他选择了每位球员职业生涯中最好的五年的战绩作为统计对象,而并非一定要是连续的五年。比如,在雷蒙德·李的研究中,他所选取的格拉夫最好的五年是1987至1991年,而麦卡锡选取的则是1987至1989以及1995至1996年两个时段:格拉夫在1995和1996年都获得了三个大满贯赛事的冠军,这些都远比她在1991年的表现成功。
按照麦卡锡的统计方法,结果截然不同,最伟大女子网球运动员的前三位是:格拉夫、纳夫拉蒂诺娃和埃芙特。
相信若同样以这个变动后的标准去衡量男子伟大球员,桑普拉斯和阿加西的排位一定都会像格拉夫那样大大提前。为这两位球员鸣冤的球迷一定还会提出很多相当有力的反驳意见,最有力的论点可能会是:桑阿两位天王的网球时代,和博格时代的男子网坛纯粹是两个概念。现今男子网球的深度岂是二三十年前可以相比,像康纳斯当年99胜4负或是麦肯罗82胜3负的成绩,在当今竞争激烈的时代无异于天方夜谭。用同一个标准套用在横跨三十年的球星们身上,在公平的表象之下,其实是很大的不公。
到底谁是历史上最伟大的网球选手,也许看了这篇文章之后,你的思路会更加混乱。这就对了,这至少印证了一个命题:谁是最伟大网球选手,这个问题也许永远不会有确定的答案。
加载中,请稍候......