企业正在被数据淹没。为了便于检索,监管者要求保存越来越多的文件。IT部门需要一个对所有一切数据进行备份的方法,以便可以快速地找到重要信息。并且,他们只有更少,而不是更多的时间来满足这些额外的要求。
“以前都是利用晚上和周末进行备份,”惠普实验室高级研究员Mark
Lillibridge说。“在当今24*7的数字经济环境中,你能有2个小时的时间来进行系统备份就算是幸运的了。”
这毫不奇怪,这是顶尖的数据存储技术之一,帮助企业同时应对数据的增长、有限的备份和恢复时间等挑战。大型和小型企业都可以从重复数据删除技术中获益。包含这一结束的惠普StoreOnce软件可以帮助用户更快和更高效地备份数据。
充分利用磁盘存储
为了加快数据备份和恢复,必须使用磁盘替代磁带。“如果你需要检索以前备份过的数据,放在磁盘上的话会快很多。”惠普实验室的软件工程师Deepavali
Bhagwat说。同时,备份及恢复丢失数据所需的时间也更少。
虽然近几年来磁盘存储的成本已经有所降低,但数据爆炸使得存储作业强度不断加大。如果每次备份都要把所有的数据复制到备份磁盘上,磁盘备份就会变得成本昂贵且不易使用。
重复数据删除技术在此刻有了用武之地。它允许在磁盘上快速备份数据,无需重复复制整个数据集,并减少了存储空间的浪费。
分解数据
重复数据删除技术把数据分解为可由哈希(hash)这种数学运算进行识别的小块。每个数据块都由哈希进行存储和识别。因为文件经常是被最小程度地修改,所以大部分数据并不需要被重复保存。重复数据删除技术读取哈希,识别出没有变化的数据块,这些数据就不会被再次保存。
重复数据删除技术只有一个缺点。它意味着当一个文档,例如公司的年报,因为一点点变化而每天进行备份,周一产生的新的数据块被存放在磁盘上的一个地方,周二产生的新的数据库被存放在另一个地方。一段时间之后,年报的数据块将遍布整个备份盘。
因此,从整个磁盘上发现并组合这些数据块可能是一个漫长的过程。惠普实验室资深研究科学家Kave
Eshghi说,“你可以对所有数据进行一个缓慢的搜索,并最终找到所需的内容;但我们需要以迅雷不及掩耳的速度做到这些。”
加载中,请稍候......