探索中国CIO人才现状 | 第四季调研报告
云存储是否需要重复数据删除?
2014-01-15  作者:中国容灾网 

  重复数据删除,压缩和其他形式的数据优化通过在备份、归档和主存储上减少现有数据的总容量,实现高的投资回报率,并且数据也得到最大程度的优化。容量节省是可以迅速看到的,而资金的节省只有看到推迟或基本上不用购买更多存储时,大家才意识到优化的好处。云存储是根据每月产生的使用容量来收费的,云存储重复数据删除优化解决方案在下一个账单周期内可以提供一个投资回报。


  每月的投资回报率云存储作为一个备份目标或归档目标都允许用户异地备份或归档数据,分散了实地存储的成本。不好的一面是虽然实地存储的成本分散了,可是,因为云存储服务的使用,产生了持续的存储成本。结果任何云存储上数据的优化就显示了每月的即时成本节省,同时也需要花费额外的努力和处理时间来最大程度减少数据,这样数据在性能方面就并不那么敏感了,因此微小的性能代价也是值得的。事实上,因为更少的数据需要通过广域网连接传输,对于网络也许是一个性能提升。


  云存储服务可以作为没有具体设备的外包模型部署,而最常见的则是应用一个混合的模式。这种模式的公司如By_cast,Nirvanix和IronMountain公司都在你的站点安装一个设备。这个设备对用户来说看起来就像一个有无限大存储的NAS,同时支持NFS和CIFS协议。把数据传到云上,然后再把数据传到一个本地的NAS中。云的迁移是在背后透明的发生的。设备在用户友好NFS/CIFS和更常见的网络协议诸如webdev或HTTP之间转换。重要的一点是,虽然是存储在NAS上,可它所表现的可以无限大的存储也是需要根据IT部门每月使用的容量来收费的。根据你的数据类型,重复数据删除技术可以每月减少存储4倍到10倍。


  云存储需要重复数据删除当努力实现优化基于云的存储时,实施重复数据删除的方式是非常重要的。重复数据删除云存储不能通过一个存储平台实现。如果重复数据删除键入到OS或存储系统中,它不知道如何和基于云的存储互动。云存储是不同的,但接入的接口可能是通过一个云网关,下面的OS肯定是不同的。


  重复数据删除云存储接下来需要一个单独的重复数据删除软件设备,一般是来源于像OcarinaNetworks公司这样可以有实际存储平台的独立公司,并且不要求从事特定存储平台,换句话说,它必须具备优化任何类型存储的能力,当然也包括云存储。像Ocarina这样的公司比其他公司先进了一步,它不仅可以删除之前写入云存储的数据,也能减少删除归档应用的开支。


  优化WAN带宽广域网带宽是在环境中应用或考虑应用云存储的另一个需要关心的问题。需要在广域网传输的大量数据也要仔细的关注。带宽的增加要求广域网带宽成本的增加,这个增加很可能作为跨用户群体接入云存储服务被扩展,且它的用途也被大家所理解。升级广域网带宽的要求可以消除任何来自云存储的节约的成本。


  扩展云归档到云备份在未进入云之前,可以优化数据的重复数据删除可以控制带宽成本。它能也允许这些归档只是系统被备份处理使用。当备份软件应用创造一个备份,特别是一个全备份,它就创建一个大的文件或一系列文件,这些文件都包含所有的需要备份的独立文件。这个文件然后就被写入磁盘。


  现在的问题是,磁盘和之前包含全备份存储的作为一个新文件的文件非常相似。为了保证专有,开发了重复数据删除系统来删除冗余数据;这些做得还不错,但他们不能和另一个存储厂商的云存储服务一起运作。但是存储不受限制(agnostic)的解决方案却可以。


  云重复数据删除架构从结构上,一个存储不受限(agnostic)的优化器可以存在于一个专用设备内,这个设备然后可以分析满足某个标准的指定文件系统,大小等,最后迁移到云存储设备上。在迁移期间,文件将会通过重复数据删除和压缩来最大程度的减少数据。最后,只有精简后的文件被存储在云NAS上,这样也可以达到节省成本的要求。


  云NAS供应商可以和像OcarinaNetworks公司来合作,整合优化器到他们的本地组成,在每GB成本战中,他们将处于巨大的价格竞争优势。


  不管哪种云存储重复数据删除的部署形式,都是对用户有益的,云存储是更独立的,同时也是成本更高效的传统存储的转变。