加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

大数据:数据开放和创新社会化的挑战

(2012-12-14 15:24:38)
标签:

大数据

云计算

赛迪顾问

杂谈

赛迪顾问 软件和信息服务业研究中心 高级分析师 姚珊珊

 

如同三年前的云计算、两年前的移动互联网一样,大数据“火”了。

火到什么程度呢?火到麦肯锡出大数据报告,火到奥巴马做大数据战略,火到学者院士讲话谈大数据,火到精明的资本市场看官们纷纷下注大数据,火到几乎所有的IT企业都忙着给自己打上大数据标签。

大数据真的火起来了。乐天派认为大数据应用能够推动信息产业创新发展、实现巨大经济效益;悲观主义者认为大数据作为2012年最时髦的词汇只是老外又一次概念兜售,新瓶装老酒、和数据仓库无异,其商业前景被过分夸大了。

那么,大数据究竟是IT界又一概念炒作的噱头,还是产业发展的必然趋势?大数据是一种单纯的技术形态,还是人类社会全面进步的里程碑?要解答这些问题,必须拨开迷雾、从大数据历史发展过程来全面理解大数据。

大数据:数据增长、IT技术进步和应用发展的必然结果

早在上个世纪六十年代,美国白宫预算局就提出了当时堪称革命性的创新计划——成立一个被称为“中央数据银行”的统一大型数据库,把政府部门所有的数据库连接、集中、整合起来,提高数据的准确性和一致性;八十年代,美国就有人提出了“大数据”概念,企业界、学术界不断对此进行探讨;1995年麻省理工学院教授尼葛洛庞帝出版了《数字化生存》,率先提出“后信息时代”的概念,指出海量数据正在流动、时空障碍将被打破,个人将在后信息时代获得更大的解放;《自然》杂志在20089月推出了名为“大数据”的封面专栏,讲述了数据在数学、物理、生物、工程及社会经济等多学科扮演的愈加重要的角色;2009年,奥巴马就任美国总统,任命了美国历史上第一位首席信息官和首席技术官,并建立了统一的数据开放门户网站Data.gov,全面开放政府拥有的公共数据,鼓励更多的创新型应用,提高政府的效率和效能;2011年,麦肯锡出版了《大数据:创新、竞争和生产力的下一个新领域》,产学研界对“大数据”的关注达到一个新的高度。

全球的数据总量正呈指数增长,过去三年间产生的数据量超过以往总和。2011年全球被创建和被复制的数据总量达1.8ZB;预计2020年全球电子设备存储的数据将增至35.2ZB。大数据已经成为一种社会现象:它既是对既往IT技术发展至今的高度抽象和概况,同时抓住了IT技术服务于人、数据蕴藏价值的本质。大数据之“大”,不仅仅在于其规模容量之大——虽然数据容量的爆炸的确给数据的采集、存储、维护、共享带来了具有研究意义的现象和挑战,但大数据之“大”更多的意义在于:人类可以处理、分析并使用的数据在大量增加,通过这些数据的处理、整合和分析,人类可以发现新知识、创造新价值,带来“大知识”、“大科学”、“大利润”和“大发展”,逐渐走向大众创新的“大社会”时代

大数据:数据开放运动和数据民主化的必然结果

1991年免费操作系统Linux横空出世;1990年代起,互联网的普及为软件自由运动推波助澜。随着越来越多的公司和个人采纳了开放源代码的做法,“开源(Open Source)”一词被正名并获得全世界软件行业的认同。

软件由代码和数据共同组成。当开放代码成为共识和现实的时候,新一代的创新者,又将眼光投向了数据。但是代码开放只涉及技术层面,而数据开放涉及面太广,不仅关乎技术,还与数据内容相关,直指安全与隐私。因而数据开放面临更大的挑战和阻力,数据开放也没有像代码开放一样在商业领域兴起。数据开放的诉求,首先指向了公共领域和公共数据,即政府采集、拥有的数据。

数据开放运动沿袭了软件开源运动的很多诉求,如通用非专有、机器可处理、获取无歧视等,数据开放运动可谓是开源运动在软件领域的深化。这种深化,不仅局限在技术领域。对美国社会乃至全世界的影响,已经渗透到政治、文化、社会生活等各个方面。

开放,已经是大数据时代的巨大风潮。

2006年奥巴马还在担任美国国会参议员期间,和另一参议员联合推出了《联邦资金责任透明法案》(FFATA),这个法案后来产生了广泛的影响,也被称为《科伯恩——奥巴马法案》。根据这一法案,2007年,USAspending.gov上线发布,成为美国联邦政府发布公共支出信息的门户网站。这是一个巨大的数据开放网站,可以对联邦政府2000年以来高达3万亿的政府资金使用情况以及30多万个政府合同商所承包的项目进行跟踪、搜索、排序、分析和对比,其数据每两周更新一次。网站上线之后,受到了社会各界的极大好评。

2009年奥巴马就任总统,上任第一天在他的总统备忘录《透明和开放的政府》中阐述“多方协作”理念:“政府应该是多方协作的。多方协作让人民积极参与政府工作。各行政部门和机构应利用新工具、方法和系统,在各部门之间、各级政府之间全面协作。此外还要与非盈利组织、企业和个人进行协作。各行政部门和机构要广泛征求公众的反馈,以评估协作的效果,确定新的协作机会。”他认为“人民知道得越多,政府官员才能更加负责任”。

20093月,奥巴马任命联邦政府历史上第一位首席信息官,4月他又任命了首位首席技术官;经过多个部门的沟通磨合、克服了众多的分歧意见,联邦政府数据开放门户网站Data.gov上线发布,全面开放政府拥有的公共数据。这些数据,其中许多曾经是政府管理人员的内部决策参考,是官员的“专利”,市民大众无权使用;而今,这些数据允许全球任何人访问和下载。这一做法被称为“数据民主化”。截至201112月,仅在Data.gov网站上,就汇集了1140个应用程序和软件工具、85个手机应用插件。其中有近300个是由民间的程序员、公益组织等社会力量自发开发的。

由政府主导、向全社会开放政府拥有的公共数据,这种做法本身就是一种创新。更重要的是,Data.gov不仅仅是一个创新的结果,它的出现,代表着数据在社会的自由流动、知识向大众的自由流动,这位更多的大众创新、社会创新提供了一个平台。

数据不会被它所激发的思想和创新消耗,相反,它可以为创新提供无穷的燃料。一小片合适的信息,可以促使创新迈进一大步。一组数据,可能会得到数据收集人难以想象的应用,也可能会在另一个看起来毫不相关的领域得到应用,因为这些创新型应用,数据的能量将层层放大。

阿创新社会化的挑战:中国准备好了么?

在大数据时代,数据将成为一种权利、数据开放将成为一种潮流,计算正在从一种必须购买的产品转变成为一种可以随时租用的服务,互联网将最终演变成智能的数据网。

在这些正在发生和演变的趋势中,大数据时代,也蕴藏着对个人、对企业或组织甚至全社会的巨大挑战。

20年来,商务智能、社交网站、RFID、云计算、语义网等技术或理念风驰电掣一般进入我们的生活,软件开源、数据开放、普适计算、智慧地球等新思想令人应接不暇,新的技术和观念在不断涌现,甚至可以用突飞猛进来形容。我们如同乘坐一列高速列车,往往还来不及看清窗外的风景,就已经呼啸着奔向下一个站台。未来列车将驶向何方?

我们的社会正在进入新信息时代,最大特点将是创新。信息的保存、加工、发布将不再是经济的重心,基于信息的创新将成为经济的先导。而且由于信息无处不在、人皆可得,新信息时代的创新将不再是少数人的专利,创新将走向大众公民,集中表现为终端用户的创新、普通大众的创新。由于新技术的广泛应用和深层渗透,引起了社会形态和社会结构方面的改变,如大众创新、个人获得更大的发展空间等。

在大数据时代,信息和数据成为最重要的资源。一旦信息自由、数据开放,就意味着信息和每一个公民之间都是等距的,而且中间没有层级的过滤。数据的开放和流动,就代表着知识的开放和流动、代表着权力的开放和流动,这种开放和流动,是多中心的、水平的。在大数据时代,社会的主体结构将从分层转向网状,在网状传播力量的不断冲击下,个人的主体价值将得到前所未有的张扬,社会生产力将得到更大的解放和发展。

大数据时代正在呼唤下一波社会化的浪潮——一个更开放的社会,一个创新主体更分散的社会。这种创新社会化的演进将是一个巨大的挑战。我们无疑需要做更多的技术创新、应用创新和制度创新来迎接这个挑战,但这仅仅是一个开始。

那么,中国,准备好了么?

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有