《大数据时代的历史机遇》连载(4)引子(2)

标签:
it |
引子(2)
具体到中国信息产业,发展速度一直落后于国外的巨头,长期处在产业链的末端,赚取刀片一样的利润,积累到最后发觉只形成了简单可替代的“中国制造”而非具备革命性创新性的“中国智造”。国家拿出大笔资金扶持上游环节的拓荒者,如CPU、操作系统、办公软件,但是相关领域国内外的差距过于遥远,也缺少大规模的商用市场,花了国家的钱,却鲜有在商业上大获成功的先例。但是在新兴的大数据处理领域,中外公司几乎站在同一起跑线上。中国作为数据的巨大产生国,有着更广阔的应用空间。比如,中国移动、工商银行、淘宝,已经具备世界级的产业应用环境。有业内人士表示,单纯考虑狭义的大数据处理技术(如Hadoop、MapReduce、模式识别、机器学习等),中外差距仅有5 年左右。如果考虑数字资产规模以及利用的技术,中外差距更多体现为意识上的差距。美国在数据开放、跨部门共享方面做出了表率,而我国对大数据的价值和应用,政府、学术界、产业界和资本市场尚待达成一致的认知。各部门、各地方普遍存在“数据割据”和“数据孤岛”的现象,缺乏大数据意识是阻碍我国大数据技术在各行业落地的关键因素。
大数据时代,有两点非常有利于中国信息产业跨越式发展。第一,大数据技术以开源为主,迄今为止,尚未形成绝对技术垄断。即便是IBM、甲骨文等行业巨擘,也同样是集成了开源技术,和本公司原有产品更好地结合而已。开源技术对任何一个国家都是开放的,中国公司同样可以分享开源的蛋糕。但是需要更加开放的心态、更加开明的思想,正确地对待开源社区。第二,中国人口和经济规模决定中国的数据资产规模冠于全球,客观上为大数据技术的发展提供了演练场。第二点亟待政府、学术界、产业界、资本市场四方通力合作,在确保国家数据安全的前提下,最大程度地开放数据资产,促进数据关联应用,释放大数据的大价值。
目前,政府和产业界积累了大量的数据资产,但是苦于缺乏行之有效的与工程实践匹配的算法和人才来充分挖掘数据的价值。形象地说,好多行业是守着“金山要饭吃”。而学术界,尤其是应用数学领域,在统计学习、图像处理、网络科学领域钻研颇深,但缺乏大量的实际数据来验证和训练算法。虽有屠龙术,无处展身手,两方长期处于脱节的状态。如果应用数学界和产业界紧密协作,将是中国公司的极大利好,会大大促进公司的发展。2012 年11 月17 日,在北京大学国际数学研究中心召开了首届“数据科学与信息产业研讨会”。学术界和企业界的一百多位领军人物和活跃分子聚集在一起,共同商讨数据科学的含义和发展计划,以及企业界的需求。这次会议为促进学术界和信息产业的联合,开了一个好头。
数据资产并不是大公司才有的专利。在第三章中将详细讨论一种“泛互联网化范式”,终端+平台+应用,最后形成数据资产。许许多多富有活力的公司,均符合这一范式。这也是创业型公司开启大数据之路的总结和探索。
自从我们在中国资本市场第一个发出“大数据时代即将到来”的声音后,大数据已经成为年度热词。综合政府、学术界、产业界的最新动向,笔者预计,如果把2012 年看成大数据普及之年,那么2013 年将成为大数据应用之年。相关产业规划、行业政策将纷纷出台;金融、电信、政府、电商、医疗、平安城市等相关应用将加速推进;2014~2016 年将是大数据效益之年,若干中国大数据公司相关业务形成爆发性增长,部分相关公司海内外融资或IPO 上市。
本书的内容将围绕大数据对产业走势、融合、变迁的影响,在产业中的具体应用(商业模式),以及数据科学的兴起三大主题展开。本章包括大数据产生的历史背景、激动人心的典型特征、系统全面的认知框架等内容,最后会简略说明推广大数据面临的困难和挑战。
----------------
关注作者:@赵国栋TMT