加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

历史数据的重要性

(2012-12-24 09:21:11)
标签:

it

大数据

在大数据领域,有两个词很有意思,“Data”是“数据”,“Information”是“信息”,几乎可以混用,但是当提到技术层面,大家喜欢用“数据”,业务层面,大家喜欢用“信息”,好像数据是死的,信息是活的。

人类对数据/信息的好奇、渴望似乎是与生俱来的,其实不需要太多的原因,只是一个“我想知道……”就够了。而当你知道而别人不知道的时候,就有生意了……你就存在为别人提供一个服务的可能。比如,“我想知道苹果公司这些年都靠什么产品发家的”,“我想知道互联网的早期是什么样子的”?这些是很正常、很朴素、也很有趣的问题,可是到哪里去寻找答案呢?我们现在的互联网似乎永远都是为“当下”、“未来”服务的,当我们被各种“当下热点新闻”,“热议微博”,“即时通讯”以及“科技趋势”,“战略规划”,“愿景”轰炸之后,我们似乎有着同样的想了解过去的需求,而这种了解过去的需求会随着手段的缺乏而变得好奇心越来越强,“苹果10年前的网页是什么样的?”,“听说有一个公司叫做Yahoo,是互联网最早期的明星,那个时代是什么样子的?”

好在这些问题在互联网上有人帮助你,有一个开放的服务叫做"Wayback Machine",Wayback字面可以有两个意思,1,“很久很久以前,比Back还要Back才叫Wayback”,2,“回去的路”,加上“Machine”,就好像是“时空穿梭机”了。

在这个Wayback Machine网站上,你可以输入一些网站,看到他们在过去的某些时间点上的样子,如:互联网早期Yahoo公司的网页是这样的:
2000年变成了这个门户的样子:

http://s15/mw690/6cf8fdd9td18f8d456cae&690

2006年8月的时候是这样的:


如日中天的谷歌公司最早的网页是这样的,1998年的时候还是Beta版呢:
http://s7/mw690/6cf8fdd9td18f9b3aa056&690
谷歌早期的公司介绍是这样的:


Sybase IQ的确是1997年就已经成为Sybase数据库家族的成员,并且正式定义为数据仓库解决方案了

我甚至找到了1999年我在美国创立的比价网的原貌,当时比较网上书店的价格以及全美各地加油站的油价……



0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有