加载中…
个人资料
惠普中国研究院
惠普中国研究院
  • 博客等级:
  • 博客积分:0
  • 博客访问:11,204
  • 关注人气:1,156
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

惠普实验室为企业用户准备就绪重复数据删除技术(上)

(2010-11-19 16:18:39)
标签:

hash

惠普实验室

重复数据

删除技术

备份

时间

it

    企业正在被数据淹没。为了便于检索,监管者要求保存越来越多的文件。IT部门需要一个对所有一切数据进行备份的方法,以便可以快速地找到重要信息。并且,他们只有更少,而不是更多的时间来满足这些额外的要求。
    “以前都是利用晚上和周末进行备份,”惠普实验室高级研究员Mark Lillibridge说。“在当今24*7的数字经济环境中,你能有2个小时的时间来进行系统备份就算是幸运的了。”
    这毫不奇怪,这是顶尖的数据存储技术之一,帮助企业同时应对数据的增长、有限的备份和恢复时间等挑战。大型和小型企业都可以从重复数据删除技术中获益。包含这一结束的惠普StoreOnce软件可以帮助用户更快和更高效地备份数据。

 

充分利用磁盘存储


    为了加快数据备份和恢复,必须使用磁盘替代磁带。“如果你需要检索以前备份过的数据,放在磁盘上的话会快很多。”惠普实验室的软件工程师Deepavali Bhagwat说。同时,备份及恢复丢失数据所需的时间也更少。
虽然近几年来磁盘存储的成本已经有所降低,但数据爆炸使得存储作业强度不断加大。如果每次备份都要把所有的数据复制到备份磁盘上,磁盘备份就会变得成本昂贵且不易使用。
    重复数据删除技术在此刻有了用武之地。它允许在磁盘上快速备份数据,无需重复复制整个数据集,并减少了存储空间的浪费。


分解数据


    重复数据删除技术把数据分解为可由哈希(hash)这种数学运算进行识别的小块。每个数据块都由哈希进行存储和识别。因为文件经常是被最小程度地修改,所以大部分数据并不需要被重复保存。重复数据删除技术读取哈希,识别出没有变化的数据块,这些数据就不会被再次保存。
    重复数据删除技术只有一个缺点。它意味着当一个文档,例如公司的年报,因为一点点变化而每天进行备份,周一产生的新的数据块被存放在磁盘上的一个地方,周二产生的新的数据库被存放在另一个地方。一段时间之后,年报的数据块将遍布整个备份盘。
    因此,从整个磁盘上发现并组合这些数据块可能是一个漫长的过程。惠普实验室资深研究科学家Kave Eshghi说,“你可以对所有数据进行一个缓慢的搜索,并最终找到所需的内容;但我们需要以迅雷不及掩耳的速度做到这些。”

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有