加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

2012年大数据市场前瞻

(2012-06-04 20:30:08)
标签:

ibm

it客

大数据

it

分类: 好望角

大数据的火爆是不争的事实,然而,市场却依旧在观望……

2011年,IT界一个非常流行的词无疑是“大数据”,最为人熟知的大数据技术是采用大规模并行处理的方式来分析。将负载切割成更小的任务然后并行处理的方式,从本质上而言,并非是什么新想法,Forrester Research分析师表示,大数据意味着规模极大的分析量,意味着高速处理批比特,(千万亿字节)的结构化数据以及非结构化数据的能力。

在过去的10年中,这一技术被谷歌和雅虎发扬光大。首先是谷歌推出了MapReduce构架,能够处理其收集的规模庞大的超乎想象的点击数据,然后是雅虎建立一个采用MapReduce的软件基础架构Hadoop,并且将之开源。

Hadoop风靡

业界对于Hadoop的需求无疑是巨大的,这一点可以从2011年IT厂商发布的基于Hadoop的产品数量看出来。

5月份,IBM发布了一款分析产品——Biglnsights,其中就采用了Hadoop技术;再就是EMC宣布将Hadoop整合到其Greenplum数据仓库设备中;6月份,雅虎拆分了其Hadoop中心并将其独立运营,新公司的名字叫Horton Works;10月份,微软宣布了与HortonWorks公司建立合作伙伴关系,为其数据库平台研发Hadoop相关产品;另外,10月份,甲骨文公司推出了其数据库设备——一种预先集成的软件以及硬件堆栈,其中包括Hadoop版本;同时,在该年度,基于Hadoop的新创公司如CloudEra和MapR持续吸引着风险投资基金的关注。

Hadoop并非大数据这把大伞下唯一受宠的技术。其它还包括比如——纵列数据库,该技术以“纵列”而非以“横排”的方式组织数据。2011年2月,Hewlett-Packard收购了纵列数据技术新创公司Vertica,由此重启了其商务智能战略。同时,SAP将HANA纳入了其创新战略中。HANA是一个纵列数据库平台,采用了2010年被SAP收购的Sybase的技术。

市场处于预热与观望期

从上文可知,现在有大量的大数据技术可供选择。然而,市场真的需要它们么?

当数据的产生是毫无章法而且是不拘泥于时段,并非像以往那样定期更新一个单一的记录,传统的数据库结构就会变得笨拙。与这种数据流相关的例子包括智能电表、网页点击以及GPS坐标等。IBM大数据副总裁Anjul Bhmabhri表示,这些数据无法推进结构化数据仓库中处理。

总部位于英国的传感器制造商Ibexis的联合创始人Andy Jones表示,“传感器数据一旦被写下,就永远不会改变,它记录的永远是某一个时间点的数据。由于这样的数据规模极为宏大,所以你需要一个系统允许你能够记录许多数据,而传统的数据库很快就会不堪重负”。

Ibexis采用的是亚马逊提供的基于云的、非关系数据库服务SimpleDB来收集数据。

随着越来越多的人开始使用GPS,传感器的价格大幅下跌,许多人预计在未来数据流只会更加庞大。例如,商务智能厂商MicroStrategy的CEO Michael Saylor就相信,与日激增的移动设备意味着许多手工操作的业务流程会逐步转变为基于软件的。他认为,没有被自动化的业务流程的数量是自动化业务流程的两到三倍,而移动设备的加入会促使业务流程的进一步自动化,由此将产生更多的数据。

许多新产生的数据将是非结构化的,这正是大数据技术所指向的重心,于是你也许会认为必须针对这种新数据尽快制定解决办法。

然而,根据Information Age 2011年所进行的一次读者调查,只有7%的反馈者采用了大数据技术,11%打算2012年采用。也就是说,虽然大数据的讨论非常激烈,但是2012年,并不会有多少用户真正赋予行动,市场还处于观望期。

 

(转载于通讯世界,2012-05-12)

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有