戏说数据

标签:
数据分析杂谈 |
戏说数据
http://s2/middle/62a52021nc06e89eb86e1&690
中国人自有住房高达89.68%,远超世界60%的水平,这是几天前西南财经大学和人民银行共同发布的《中国家庭金融调查报告》中出现的一组数据,这组数据引起了网民的反感,大多数公众觉得与自己内心的定位不相吻合,这正好说明了公众比较尊重自己内心的感觉,而不太会采信那些比较模糊、看不见摸不着的数据,更不要说这种不知是如何统计出来的数据了。
数据一词在字典上的解释是科学实验、检验、统计等所获得的和用于科学研究、技术设计、查证、决策等的数值。而在一些公众信息发布的平台上数据更是有关部门新旧对比、凸显成绩的凭证,诸如上面的这种自有住房率、还有防腐成效满意度、中国人均GDP等等,当然也包括各级政府、部门层层上报的各种数据,其中大部分多有这种沾沾自喜的自恋成分,只不过欣喜和自恋的多半是统计数据的人或需要这种数据的人,所以,远离受众,受众不领情也在情理之中。
六年级的数学教材中有中位数、众数的教学内容,中位数、众数也是用来分析有关数据的,在我的记忆里小学教材中引入中位数、众数的教学也不过是近几年的事情,过去的小学教材中用于分析数据的只有平均数,平均值是总额除以数量,显示平均水平,中位数某种程度上可以看出人群的指标分布,而众数是一组数据中出现次数最多的数据。
因为平均数在有的时候并不能客观的反映真实的情况,有这样一道题:某村有十户,一户有百万,其余穷光蛋,每户均十万,户均十万能不能反映这个村子里农户的贫富状况呢?很显然在这里平均数并不能说明问题;再有,有一公司招聘员工,允诺人均月工资1800元,可月末老王实领工资650元,不满问及当初允诺之事,原来月均工资1800元不假,只因为工资最高者为月资18000元,当最大数值与最小数值出现极差的时候,平均数就不能反映整体情况了,公司老板招聘只不过是玩了个数据游戏罢了。
可能正是因为此,数学上才有了中位数和众数的产生,因为在分析数据时中位数和众数在某些时候能够弥补平均数的不足。
我在这里引用平均数、众数和中位数的概念只是想说明统计数据的方法有多种,统计的目的有不同,我们根本没有必要为数据与自己内心感受的不同而愤愤不满,权且当做一种消遣而已,因为,有些数据实在离公众太远了,即便是你有一万个不相信,该有的数据仍然会有,仍然会频频出现。
数据本无辜,只因……