引用数据如临深渊 解读数据慎思明辨
(2014-10-29 04:12:11)
标签:
引用数据解读数据 |
分类: 生活杂谈随想 |
引用数据如临深渊 解读数据慎思明辨
宋国明
数据能说话。一个人陈述主观感觉一般用不上数据,追求女友,说我一见你面脉搏跳动能从每秒65骤增到83,大概不会太有用,除非你让她立刻给你把脉验证,那才可能有点意思。如果她肯把脉,下次再乍起胆子拿心跳说事。陈述客观事实则不同,有时千言万语不如一组数据,你问一个短跑运动员表现如何,我光说他跑得像风一样快可不成,得拿出他具体的速度成绩,百米9秒43什么的。你问一家饭馆如何,我说某某网几颗星、某某网几颗星、一千个人评价,999人夸好,这可能比我说别的都来得有用,这一点广告商与消费者都清楚得很。
数据在评论分析文中尤其能说话。在一篇论说文中数据的地位可轻可重,轻则做为论点的范例佐证,重则甚至可以做为通篇论点的主要根据。例如我讨论申请美国医学院,说它竞争激烈,到底如何激烈法,很难?极难?抑或比登天还难?这都很抽象。如果我告诉您某校去年的录取率是申请者15%入围面试,其中20%最终获得录取,那就很明白了,该校是一百个人里取三个,这个数据是说明申请医学院极难的具体实例。做为文章论点的主要根据的例子也很多,譬如国内男女性别比例失调情况根据国家计生委统计2012年七月为116.9:100(男多女少),有些省份甚至高达135:100,所有讨论男女性别比例失调的原因、社会问题、及政府对策等等都围绕着这个数据打转。
无论数据在文章中扮演的角色是轻是重,是主是从,因为它代表的是不容辩论的客观事实,所以用的适当就具有强大的说服力。但是问题也就在这里,有的数据不一定有关,有的数据不一定完整,遇到不诚实的作者,有的数据甚至不一定正确,所以一个有经验的读者在阅读时遇到数据一定要慎思明辨,想想文中的数据:第一,是不是来源有据,可以证实真伪,第二,数据是否完整,能让读者看清问题全貌,还是作者只选择部分有利的数据,而隐瞒了部分事实。第三,要用清楚的逻辑思维,判断数据与作者的结论是否有关,如果有关,是属于必然的因果关系,还是间接的相关。审慎的读者不会轻易被不相干的数据说服。
美国教育注重训练学生从小写作就对自己的文字负责任,认为这跟说话一样,是跟人格品德有关的;另一方面,他们也训练学生成为一个合格的读者,教他们在阅读时讲究慎思明辨,运用逻辑分析能力,判断文章论点是否正确。这是他们教育的基本路子,对孩子影响很深,至于个别学生修的道行深浅,那是另一回事了。据我的观察,一般大学生作为读者还是比较有判断能力的;写文章,虽然偶有贪图省事抄袭剽窃的,但胆敢信口开河捏造数据的则极为罕见,因为他们知道造谣比剽窃更不道德……哦,对不起,我收回“极为罕见”四字,我在美国大学教了二十几年书 ,还真的没碰上过一个造谣者。
所以,我自己写文章,在引用数据时是很小心的,因为我总是抱着一个随时接受读者质疑、随时向他们提供来源信息的心态,说是如临深渊如屡薄冰并不为过,自己要查数据来源是否可靠,所选数据是否切题,觉得弄错了的话丢人。若是写网络上的博文,有个引文或数据什么的,我常常就马马虎虎不加注解说明出处了,一般是有意为之,省得看起来太正经八百,弄得跟写学术论文似的,惹人讨厌。但就这么马虎,还不免偶尔习惯性地注出处、引页数。有人说我有些博文严谨,每次见到这样的评语都让我脸红心跳,不好意思应承,假装没看见。
这两天无意间看到了一篇有关美国梦碎的文章,可以说是使用数据最坏的例子。文章好像是国内一个没有来美国做过美国梦的周姓年轻人写的,内容主旨如何我们不去讨论,光是使用数据这一块儿,那真是信口开河,捏造事实,完全没有一丁点儿合格作者应有的道德底线。譬如说,明明是可以轻易查证详细数据的美国高中毕业率,这几年在百分之八十、八十一左右,可是这位作者为了支持他的论点,信口就瞎编了一个“大部分美国公立学校的高中毕业率只有30%到50%”,说如此没有任何根据的话,等于造谣。再举一例,为了说明美国物价高,他用一刀切的方式说三万美元“连个二手宝马都买不到”,好像宝马车只有一款一个价儿?类似这种数据,“梦碎”文中颇多,稍有常识的人都能立刻辨明这是一个脑筋不清楚人品不过关的人信口胡诌的,已足以说明该文不值一读。关于“三万美元买不到二手宝马”的说法,现成的反例不假外求,我这儿就有,我1991年找到全职工作,买的第一辆车就是二手的宝马,86年的325es,连税一万一,车虽非好车,但也忠诚地驮了我八年。您要有兴趣,我上税的加州牌照号和其他资料可以供您查证,保险费、维修费等都跟作者说的数据有很大的差异。
好笑的是,就这么一篇充满伪数据如腐烂的带鱼般臭不可闻的文章竟然有人闻之欢喜,为它背书。还“正能量”?哈哈,没想到亩产万斤的好时代又来临了,估计台湾人又得吃烂香蕉皮了吧?我特想问,这整件莫名其妙的事是不是凸显了一个更严重的问题,那就是如果有人拿爱国做幌子,说我的手段虽然下作,我的数据虽属捏造,但是我的初衷是好的,一切便都合理合法,是这样吗?我认为一个社会里,上起治国大吏,下至髫龄小儿,都不能有这种不顾道德造谣诬赖为达目的不择手段的错误观念才对。
抱歉,想到伪数据便扯远了,回到主题吧。无论作为一个读者还是作者,我们都要对使用数据有一番深刻的认识。在拙文末尾,我给您提个建议,北卡罗来那大学教堂山分校的写作中心有一篇关于使用数据写作的文章,全文甚短,长仅八页,写得浅显易懂,既指导读者如何慎思明辨正确解读数据,也教育作者应该如何有效而且负责任地使用数据。我在此真诚推荐诸位抽空看看请点击,尤其是那些准备来美国上高中、大学的莘莘学子。该文最后的结尾一段非常有教育性,洋人的想法与国内喜欢闻带鱼腥臭的主儿相比,一正一邪,泾渭分明,让人喟叹不已。我谨粗译如下,作为这篇短文的结束: