贝叶思咨询
闫成印
引言:大数据正走在由概念向应用发展的道路上,而哲人们已经开始在思考大数据对人类创新与发展的影响,美国在国家战略性的利用大数据创新方面已经先行一步。
一、大数据天生就具备推进人类创新行为的潜质
贝叶思咨询认为大数据作为数据挖掘与分析系统,其天然便具备推进人类创新的潜质。大数据的提出是基于一个时代的特征的:数据量按等级逐年窜升,数据类型从结构化数据扩散到百结构化数据,文字、图形、视频等数据的大量攀升,数据规模直线上升,数据挖掘的价值正快速提升。综合多家权威研究报告,贝叶思咨询认为大数据是具备5V特征的,即数据价值越来越大(Value),数据各类越来越多(Variety,含结构化、半结构化、非结构化等),数据数量越来越大(Volume),数据增长速度越来越快(Velocity,要求快速处理),数据的真实性(Veracity,存在大量伪数据)是大数据时代也必须面对的另外一大特征。而再看历年来的人类创新行为,其实是与大数据有必然的联系的。人类传承知识体系的方法曾经经历过甲骨文、文字到印刷、出版、电子化、信息化等系列发展历程。而人类的创新往往是离不开知识的分享与传承的,其间离不开人类的创新性的实践,正是借助于创新的实践结合前人传承的知识,人类的创新其实整体上是呈现了加速的进程。而大数据则在一定意义上将替代人脑的一部分需要运算量、存储量、分析量较大的工作,只将有益创新的结论或者线索展现出来,从而,我们可以说,大数据天然即为人类创新行为而提供了划时代意义的支持,从此之后,人类大脑将在创新行为当中得到最大程度的解放。大数据自己本不会创新,而人类的创新思维结合大数据处理与分析技术的强大力量,则有可能会引发前所未有的创新浪潮。因而,大数据作为一项划时代的工程天然就有了推进人类创新的潜质。
主流专家观点认为,大数据技术将是未来获取新知识和创造新价值的利器,大数据技术的广泛运用将创新性地推进经济和社会发展,甚至政府管理与运营产生深刻的影响。例如,卫生医疗数据能使医疗机构监视医疗体制的现状、民众的健康趋势、评估不同的医疗技术和治疗方案;能帮助政府评估和选择医改方案、医保体制;能源领域的大数据可能帮助电力系统推行节能方案;交通运输的大数据可能用来疏解交通拥堵;而信息系统的大数据可用来确定潜在的网络安全隐患。从企业领域来看,大数据已经在包括互联网在内的多行业企业当中开始得到应用,并发挥创新带来的影响。
大数据推进基础研究创新已经开始得到认识与推进,而专家们已经开始在评估大数据可能带来的价值。专家认为,大数据技术特别能推动大学和国家实验室的基础研究,如人体基因排序、数字天文学和粒子物理等领域的研究项目都已得益于大数据技术的进展。目前,该项技术已经在产业界得到初步应用,如公司可通过大数据分析管理供应链、以用户偏好为基础开展市场营销、通过分析运行效率降低成本等等。据麦肯锡全球研究所预测,有效的数据管理每年可给医疗卫生行业带来3000亿美元的价值。
事实上,大数据技术最伟大的意义在于其能够影响科学研究本身的发展,使科学从过去的假设驱动型转化为数据驱动型。例如,约翰霍普金斯大学(Johns
Hopkins University)物理学教授Alex
Szalay指出,他与同事们正在使用大数据技术来建立验证宇宙大爆炸理论的数学模型。这表明,应用了大数据技术,人们开展科学研究不再是先从提出自己的假设出发,而是可以首先进行数据分析,然而再深入一步提出科学假设。
二、美国将大数据作为一项创新战略先行一步
为了应对大数据技术提出的挑战,科学家和工程师们必须要在信息技术领域做出重大创新:需要开发能以更高的速度处理如此复杂的海量数据的高性能计算技术;要求数学家和统计学家开发能分析这些数据的新算法;要求数据分析专家运用新的技术从数据中“萃取”更大的、甚至意想不到的价值。美国在战略性地利用大数据进行创新方面已经先行一步。
截至2013年,大数据已经成为美国创新发展的重要战略。
一项史无前例的关于大数据推进创新的听证会见证大数据创新战略。2013年4月24日,美国众议院科学、空间和技术委员会举行了以大数据为专题的听证会,邀请了IBM公司的技术高管、北卡州立大学(North
Carolina State
University)的资深教授和国家科学基金会(NSF)的高官就信息技术和数据分析领域的技术进步如何能促进海量数据的分析和利用、大数据技术如何激励创新以推动新产品和新服务的发展、美国在数据分析技术领域的创新能力、大数据技术研发现状与科技管理方面的挑战和专业人才的培训以及公民对数据的知情权、如何保护与数据相关的个人隐私等多个议题进行了讨论与听证。与会专家们开始思考如何让美国在大数据技术领域的创新方面领先、研究私人企业与联邦政府的合作在促进大数据领域的创新的作用以及讨论奥巴马总统提出的大数据研究计划的进展等等问题。NSF负责计算机、信息科学与工程的助理主任Farnam
Jahanian在国会作证时,以政府多个大数据技术项目为例说明,这项技术将引领各领域(特别是在医学研究、天气预报领域)的创新。由NSF负责投入的项目包括,推动大数据技术发展的基础研究、建立新的多学科研究团队、教育和培训专业人才以及建设和应用能捕获、管理、分析和共享数据的网络体系。对网络体系的投入中有超级计算机的研发计划,因为Jahanian认为,计算与数据是一枚硬币的两面,而必须同时解决这两方面的问题。大数据技术具体涉及很多领域,其中包括数据管理、数据建模的数理方法和支持业务决策的数据可视化技术等。在美国国会历史上,专门就某一项技术创新举行听证会是极其罕见的现象。这显然表明,大数据技术极其重要,他是实施美国奥巴马总统以创新推动经济复苏的战略决策的关键所在。
美国在全球少有的以政府主导大数据创新战略,而美国联邦政府在大数据技术创新领域一直扮演积极引领各界的角色。早在2010年,总统科技顾问委员会(PCAST)就提出了长篇研究报告:“设计一个数字化政府:联邦政府的网络和信息技术研究开发”。报告指出:海量数据的管理和分析向我们提出了挑战,网络和信息技术将在数据向知识和行动的转换过程中发挥至关重要的作用,他将支撑美国的繁荣、健康和安全。过去几十年联邦政府对网络和信息技术研发的投入,不仅催生了数据的爆发性增长,而且也大大提高了美国获取、存储、分析和利用这些数据的能力。美国在机器学习、知识表达、自然语言处理、信息检索和整合、网络分析、计算机视觉和数据可视化等领域已取得了基础性的进展,这些成果使大数据技术的应用和系统具备了全方位改变人类生活的潜力,将为增强美国未来数十年的全球竞争力奠定基础。一年多以前(2012年3月),奥巴马政府又推出了“大数据研发计划”(Big
Data Research and Development
Initiative),准备由联邦政府投入2亿美元来改进处理海量数据的工具和技术。参与该计划的有NSF、国家卫生研究院(NIH)、国防部和国防高级研究项目局(DARPA)、能源部和国家地理调查局(USGS)等六个国家机构。该计划试图通过资助处在知识创新前沿的大数据领域的研究活动、充分发挥美国教学与研究机构各级研究人员的智能和加强公私部门、政府部门之间的合作伙伴关系等举措,达到加快科学和工程学领域发现的速度、强化国家安全、改革教学方法和降低医疗成本、改善医疗效果等目标。
2013年4月初,NIH在2014财年的预算中计划至少拨款4000万美元来启动一项“大数据向知识转化”计划(
BD2K ,Big Data to Knowledge )。该计划的内容包括:(1)
从政策、资源和标准等方面拓展庞大而复杂的生物医学数据集的利用与共享(这些数据来自于各种设备,如基因测序仪、高分辨率医用成像设备、电子医疗记录仪和能监视病人的手机应用程序等);
(2) 开发和推广新的分析方法和软件;(3) 加强数据科学家、计算机工程师和生物信息学家的培训;(4) 设立精英中心(Centers
of Excellence)以期开发能解决生物医学数据分析、计算生物学和医学信息学(Medical
Informatics)等学科中重大问题的通用方法。
奥巴马在推出了为期十年、耗资数十亿美元的人脑研究计划(BRAIN,Brain
Research through Advancing Innovative Neurotechnologies
Initiative)时指出,由于人脑的信息量极其庞大,该计划必须要借助大数据技术方面的突破才能取得成功。美国总统科技政策办公室(OSTP)主管技术与创新的副主任
Tom Kalil 最近指出:
掌握了大数据技术就能实现经济增长、教育、医疗健康、清洁能源、增强竞争力、应对重大挑战和激励创新等领域的国家目标。
看来,大数据技术由此已上升为关乎美国政府重大创新计划成功与否的关键技术。
三、应充分利用大数据推进人类创新进程
贝叶思咨询分析认为,世界各国应充分利用大数据来推进人类创新进程。
如前所述,人类对于大数据辅助人类创新方面有着重要的价值,因而,充分发挥大数据在政治、经济、社会、科技、文化、卫生等诸多领域的重要作用,尤其是将其用于技术与应用的创新成为历史的必然。
大数据具备推进人类创新的潜能,而哲学上看,凡事有利必有害,大数据由于在一定程度上代替了人脑的工作,因而,其天然上可能会给人类思维创新带来惰性,从此意义上讲,这对于未来的人类创新行为是有害的。可以想像在人类发明了电之后,到如今人们对于电的依赖性已经多么强了,而对于没有电的情况则一直没有太有效地措施,可以说断电的损失往往是不可估量,而大数据对于人类而言同样会产生依赖性,虽然不像人类对于电的依赖性那么强,但是考虑到人类的惰性思维,如果长期依赖大数据创新的技术面,而不持续加强在主动利用思维方面的创新,从而保证人类思维创新的同步性,那么未来大数据可能会从长远来看限制人类的持续创新行为。
综上,在规避大数据的桎梏的前提下,充分发挥大数据的创新工具作用,将人脑持续创新的思维与大数据的优势充分结合,将会有效地推进人类创新进程。
加载中,请稍候......