大数据就是一个噱头
(2012-11-14 13:50:53)
标签:
结构化数据数据网生产模式数据格式大数据 |
分类: 较真儿 |
当下,大家都在议论大数据,说者众多,都从各自的角度上论述,说是一种创新,一个伟大的变化,一次史无前例的革命,什么什么的。概念简直就像一锅浆糊,众说纷纭,让人头疼,实在就是一个商业行为。
大数据,就是数据量大而已。多大才能称为大数据,记得上世纪80年代,20兆的硬盘如何?够大的吧?如今几个T的不算什么,论P才算大阿;也就是说,大数据就数量值大了,单位大了而已。
大数据,自古到今格式一样。底层的数据格式,有文本的、图像的和流媒体的,这些过去就是,结构化的啊。哈哈,比你想象的要丰富;自从有了数码照相后,胶片就数字化了,大数据就是数字化。不同之处,就是数据量大了,数据流粗。
大数据,就是一个有序和无序交融而已。当前的数据,简单划分有两个部分组成,一部分是有序的,有头有脸的数据。大家公认的行为方式下产生的数据,你可以通过填表、照相、录像等方式获取,号称是事务性数据,大家称为结构化数据。另一部分是所谓无序的,来路不明的数据。在互联网上,个人或群体们一通的胡造,写一些博客,聊一些闲天,哈哈,一般称为非结构化数据。他们有一个共同之处就是数据格式基本相同,如DOC\TXT\TIF\RMV等等,没有什么了不起的。不同之处,无序的数据就象垃圾一样充斥着网络,多啊。
大数据,在网络上就象一股数据流。数据格式当下看都已知,数据也就分为有序和无序的两种;如果你需要采集数据,有序的就不必说了,无序的你就用一个模块来抓取,想要什么,就产生出什么信息。比方说,生活中你需要保存冷冻物品,就买一个冰箱,插在电门上,就运行了。想点灯,买一盏灯就照亮。同样,你如果需要GDP、CPI数据,你可以买一个统计采集模块,插到网上就好了,显示出你要的数据。所以说,大数据就是大数据。
大数据,把它移动到GOOGLE上,Google就像一个数据网,产生网络数据,组成信息社会的能源网络,每一个人都是一块燃料棒,人人、新浪等都是大的能源厂,大家一起带动数据网产生能源,这是一个新的能源生产模式。
我只好说,大数据就是大数据,Google就是一个数据网,这网路上跑着大数据,没有什么奇怪的现象阿。