标签:
杂谈 |
分类: 读书 |
十九世纪的英国首相迪斯雷利说:“世上有三种骗人的东西:谎言、该死的谎言、统计数据。”
今天总算看完了统计学教授Walter Kr?mer写的《So lügt man mit Statistik
(统计学的谎言)》,坐车时的专用读物。可是因为很少坐车的缘故,不太有机会读。家里还有很多买了从没翻过的书,但因为这本最薄,加上是数学专业出身的校长去年送给我的圣诞节礼物,怕他哪次撞见我的时候想起抽查,便先选了它来读。
书里面的道理浅显易懂,揭示了那些数据表象之下的东西,很是适合头脑死板不转弯的德国人阅读。
书共分16章节,
分别为“骗人的精确度”、“骗人的基数”、“骗人的曲线”、“骗人的百分数”、“骗人的平均值”、“骗人的趋势线”、“骗人的最高值”、“骗人的抽样”、“骗人的比较图”,等等等等。
书的开头写道:“统计数据与我们的生活息息相关,每天打开电视、摊开报纸,总会有各种各样的数据跳入眼帘。比如:失业者变多了或变少了、癌症和臭氧层的危险愈演愈烈、每个德国人每年消耗5.8升的冰激凌、音乐家比其他人更长寿,农村的空气很健康、农村的空气不健康、2010年世界人口将达到100亿、驾车闯入单行道的女性比男性要多25%、纽约的中央公园是睡觉最安全的地方,等等等等。这些数据往往都是不准确的,杜撰这些数据的原因大多是为了达到某种宣传目的,使观点显得更有可信性和说服力。”
“1909年4月6日美国人皮尔里作为第一个临近北极点的人声称他当时的位置是北纬89度57分11秒,距离北极点约5公里。但事实上,皮尔里当时用他身上有限的工具不可能得出如此精确的数据,即便在现代卫星测量设备发达的今天,也还是需要费很多的周折。”
“圣经里说,亚当活了830岁,他的儿子塞特活了912岁。无外乎是说,这些男人和一般人不一样,这样总比说他们的寿命‘很长’要更有可信度。同样道理,巨人哥利亚并不只是‘很高’,而是正好身高六肘零一虎口。”
看了这本书后,不禁会对见到的所有统计数据产生质疑。书里揭示了一些操纵数据的方法和技巧,比如改变横轴上的时间间隔让趋势线的变化看起来更陡或更平稳、比如避重就轻地取样、比如在比较图中呈现物体的非真实体积,等等等等。
总之,下次如果再看到德国联邦统计局公布“德国共有61140461个居民(其中2228788人为失业人员,4240500人持有外国籍),他们与24502300头猪,1779000只羊和15806300头牛共同生活在一起”之类的数据,大概只会觉得好笑而已了。