加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

提高对数据的认知1

(2022-08-07 11:23:31)
分类: 学习
提高对数据的认知1

很多数据其实并不像表面上那样客观、公正,反而常常会因为一些人为或非人为因素的干扰,对人们产生误导。
数据研究的过程分为三个步骤,分别是数字标准化、数据采集,还有数据分析。
下面一个一个来说。你会发现,这里面的每一步,都存在着容易被忽视的陷阱。而正是这些陷阱,使得一些数据并不能客观反映事情的真相。
首先第一步,是数字标准化,指的是,给你的研究对象建立一个统一的测量标准。比如,如果我说,在锅里放一把米,这就不是一个标准化的说法,因为我抓一把米跟你抓一把米,重量不太可能一样;但如果我说,在锅里放200克的米,这就是标准化的说法了,因为它是放之四海通行的。
像距离、重量、人数这些物理世界中客观存在的事物,标准化起来是比较容易的。但是,随着人类社会的发展,我们开始试图去测量一些人为创造出来的概念,比如经济发展水平、智力水平、受欢迎程度、信用程度,等等。这个时候,很多问题就随之出现了。
首先,并不是所有概念都能转化为标准化的数字。比如,幸福,本身就是一种主观的感受,我们不可能把所有人的感受都拉到同一个量化维度里。
还有,把一个概念标准化的方式有很多种,但很难做到准确或全面。比如,最有名的例子,莫过于GDP了。我们知道,GDP,就是国内生产总值,它是一个经济体在一段时间内所制造的商品和提供的服务的市场价格的总和。当我们在说一个国家贫穷或者富有的时候,主要看的是人均GDP,它能体现一个国家民众的平均收入水平。
但是,多年来,反对把GDP作为衡量一国富裕程度的声音一直很多。理由包括,GDP没有考虑到那些发生在市场交易以外的创造价值的行为,没有考虑环境恶化等隐性成本,没有考虑收入分配,不能衡量人们对生活的真实感受,等等。人们也尝试提出过一些替代GDP的复合指标,比如“社会健康指数”“国民幸福指数”“人类发展指数”等等。但是,没有哪个指标能做到尽善尽美。
你可能也发现了,不管是GDP,还是“社会健康”“国民幸福”“人类发展”,其实都只是人们对于经济发展的不同定义而已;它们到底包含哪些衡量指标,取决于人们对于经济发展这个抽象概念的价值判断是什么。价值判断不同,采用的衡量指标也不同。这也是我们接下来要说的,数字标准化过程中的更深一层的问题,那就是,所有的、把抽象的概念标准化的过程,都是建立在人为的价值判断之上的。
我们再举一个例子。比如,拿智力这个概念来说,有一个很有名的智力测试工具,叫“韦氏智力测试”,是美国医学心理学家大卫•韦克斯勒主持编制的。这是世界上应用最广泛的智力测试之一,里面的题目主要涉及常识题、算术题、找不同、拼图案,等等,主要关注的是被试者的抽象思维能力。
但问题是,抽象思维能力强,就意味着智力水平高吗?并不一定。这只是智力测试设计者的一个价值判断而已。近一个世纪以来,也陆续有研究指出,以抽象思维能力来衡量智力,是有局限的。
如果换不同地区、不同种族的人来设计智力测试,那测试的内容可能完全不同,因为他们都会把自己认为重要的问题放进去。无论是由谁来设计一个把抽象的概念标准化的方案,都只能代表一种特定的价值判断而已,并不意味着,这就是一个客观的选择。
所以数字标准化这个步骤中存在的问题,主要集中在那些人为创造出来的概念上。
数据收集这个步骤。
最典型的一种,以数据收集为主的社会研究方式,莫过于民意调查了。所以书里在这部分,也主要是以民意调查作为场景,来为我们讲述数据收集过程中的常见问题。
从本质上来看,民意调查其实就是从所有民众当中抽取一小部分作为样本,然后调查样本人群对某件事的看法,以此来判断民众对于这件事的整体意见。这个过程听起来很合理,就像我们在煲汤的时候,舀起一勺来尝咸度一样。
然而,在现实中,人们却经常发现,民意调查的结果,跟实际情况并不相符。
如果调查问卷的设计是合理的、中立的,问卷上的问题不具有误导性,那么主要的问题大概率是出现在对于样本人群的选择上。很多民意调查,调查的都不是真正的“民意”,只是某些特定群体的意愿。
对于“样本局限性”问题,人们也在努力寻找解决方案。比如,改用随机抽样法,也就是,先把要调查的所有民众都列出来,然后从中随机筛选出要采访的样本,一一去联系;
或者,改用配额抽样法,也就是,先把要调查的民众分为几个类型,比如,住在城市的成年男性、住在城市的成年女性、住在农村的未成年男性,等等,以此类推,然后,按照真实的人数比例来设计样本人数,再去全国各地寻找受访者。
不过,这些方法也并不完美。
比如,随机抽样法,可能存在受访者失联或者拒绝参与调查的情况,那么最后被采访的那些人的代表性也会有所下降。
而配额抽样法采用的人群分类,看似考虑周到,但事实上,分类的依据也只是研究设计者本人的主观判断,它假定人们的意见仅仅受到一些显性因素的影响,比如收入、性别和年龄,等等;但除了这些之外,人们的意见还可能会受到性格、梦想、儿时经历等其他因素的影响。
目前,我们并不清楚影响人们意见的因素到底有哪几种。这也意味着,民调机构无法确定,到底要在哪些因素上对数据加以修正。
所以要明白:人们采集到的数据永远不可能精准地反映现实;透过数据看现实,就像是透过磨砂玻璃看东西一样——你可以看到一个大致的轮廓,但永远都无法完全看清楚。
数据分析过程中可能出现的问题。
首先一个被人们提到最多的问题就是,相关关系不是因果关系。
造成“伪因果关系”的两种情况:偶然事件,以及存在其他因素影响。还有第三种情况,那就是“反向因果”,也就是,把原因和结果搞反了。
数据分析中还有一个更重要的问题是,一切数据分析结果的背后,都存在着人为的选择——不管是有意识的,还是无意识的。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有