探索中国CIO人才现状 | 第四季调研报告
面向对象的存储究竟怎么做?
2015-07-23  来源:techtarget

记得在一篇介绍对象存储的文章开头这样写道“那些没有为数据库或文件系统写过代码的上了年纪的程序员应该不太可能会读这篇文章。毕竟,一般商业应用程序访问其他数据类型的模式已经存在超过 40年了。”

言下之意,对象存储代表了新时代下的新型数据结构类型,但是对象存储的出现也与存储发展的历史密不可分。在Web2.0、云和数字内容爆发的时代,类似数字视频和移动网络之类事物的增长,产生了极大量的非结构化数据。存储厂商也推出了新的基于对象的存储系统,从而来提供更加简单的管理和具有更佳扩展性的元数据格式。相比传统存储,对象存储的关键优势在于其简单性。由于对象存储不依赖于LUNs和卷,因此新的存储容量可以通过简单配置加入到运行系统中,实现横向扩展( scale-out)。

对象存储与Hadoop 云存储

目前,对象存储的规模部署则由云服务所引领,如亚马逊 S3、Facebook。现在,无论成熟厂商还是新兴厂商的对象存储解决方案都已达到相当的成熟度,因而IT部门开始考虑如何在自己企业中实现对象存储。除了面向对象的存储,还有基于Hadoop的云存储。中国惠普云计算事业部高级产品经理吕洪在近期的视频访谈中提到:“对于那些要求访问控制的应用,对象存储系统是个不错的选择,而用云进行大数据分析的则要考虑Hadoop。”

对象存储系统可以在一个持久稳固且高度可用的系统中存储任意的对象,且独立于虚拟机实例之外。应用和用户可以在对象存储中使用简单的API访问数据;这些通常都基于REST架构,但是也有面向编程语言的界面。

同时,需要在云端进行大数据分析的用户则可以考虑Hadoop云存储,比如AWS提供了弹性Map Reduce (EMR)。云存储选择适用于广泛的需求,但是要针对你的需求找到正确的存储类型,也意味着要找到延迟、易用性、数据完整性和成本之间的合适的平衡点。

对象存储数据迁移和访问

企业对存储的诉求有一定的延续性,但其访问的介质不外乎是主机、PC、移动端以及应用,针对不同的访问介质来看,面向对象存储的解决方案也有所不同。比如微信,我们可以在微信中上传和访问照片、视频等内容,这是一种面向对象数据的访问和存储方式;然而如果应用软件不支持HTTP下REST API的方式,需要以传统文件服务器协议的方式访问,则需要在面向存储对象前面加一个网关进行协议的转换。

没有了文件存储系统中的NFS或CIFS来给应用提供数据,面向对象的存储系统需要替换掉位于磁盘上的原始数据块和应用可以理解的文件之间的这个抽象层。现在的面向对象的系统使用类似REST标准的API或者私有的API来告诉应用如何存储和读取对象标识。

总体而言,对于面向对象的存储的操作的本质并不会改变。吕洪介绍:“比如我们熟悉的开源对象存储系统OpenStack Swift。基本上就是POST,GET ,PUT和 DELETE操作,如果你需要上传大量的数据,则需要编写一个脚本就可以实现。”

惠普的对象存储创新

OpenStack Swift是一种开源的对象存储系统,以一种既满足了存储数据服务等级要求且经济的方式实现。从高可用性以及安全稳定的角度上看,目前开源Swift并不如传统厂商做的好,但是却可以通过标准的服务器,集合Swift搭建出一个能用且经济的方案。

但是传统厂商有自己的优势,从对象存储的设计结构来看分为三层,底层硬件基础架构用来承载数据,在此之上则是面向对象的管理软件,也就是系统层,最顶层为接口层,也就是用户通过何种方式来存取数据。吕洪表示:“在这三个层次上面惠普的解决方案都有涉及。”

众所周知,惠普一直以来都在基于OpenStack进行持续研发,推出更加符合企业级用户要求的解决方案。此外,惠普实验室中也在基于ProLiant x86服务器,力求为swift寻找到一种更经济的承载方式。惠普基于OpenStack Swift构建的Helion Content Depot则是第一款集成化的完整对象存储解决方案,针对横向扩展的对象存储,提供当今企业存储系统所需的高度可扩展性、易管理性、恢复能力和安全性。

吕洪提到:“预期不久的将来,惠普则会正式推出专门针对大数据的面相对象存储的服务器阿波罗4510。”据了解,阿波罗4510的一个机柜中可以提供5.4PB的容量,这是在目前整个行业中,单机柜容量最大的存储解决方案。

除此之外,惠普还提供了面相对象存储的数据加密工作,一部分确保用户的数据在传输过程中是加密的,另一方面也首创硬件的加密,确保对象存储数据的安全性。