探索中国CIO人才现状 | 第四季调研报告
存储网络技术浅析
2013-11-20  作者:万方数据 

 当今所说的“存储”是包含传统存储介质在内,结合网络、通信等相关技术,向着虚拟化、网络化方向发展的一个全新概念。附网存储(NetworkAttachedStorage,NAS)、存储区域网(StorageAreaNetwork,SAN)和IP—SAN是网络存储技术的三个主要方向。本文将就网络存储技术的关键概念、关键技术、研究结果和应用,以及未来发展趋势进行介绍。

  一、国内外研究现状

  NAS和SAN是网络存储中的两大关键技术,围绕这两大技术,当今网络存储技术的发展方向主要有:NAS和SAN的集成技术、IP存储技术、网格存储技术、虚拟化存储技术、对象存储技术、存储机群系统、基于光纤通道的SAN(FC—SAN)和基于IP的SAN(IP-SAN)(在IP_SAN中,iSCSI是应用最广泛的技术)、分布式异构存储网络、网络存储设备、网络存储集成技术研究、串行SAS(SerialAttachSCSI)。NAS解决方案:NetAppFAS270C;SAN解决方案:DELL,EMCAX1O0。

  二、关键概念与关键技术介绍

  (一)存储虚拟化技术

  存储虚拟化的核心工作是将物理存储设备映射到单一逻辑资源池。为用户和应用程序提供虚拟磁盘或虚拟卷,隐藏具体物理设备的物理特性。从而实现对存储系统的集中管理,使客户的存储系统容纳更多数据,更多的用户共享同一个系统,存储管理操作(例如系统升级、建立和分配虚拟磁盘、改变RAID级别、扩充存储空间等)变得更为简便。

  根据数据与控制信息是否使用同一通道传输,存储虚拟化可以分为In-Band和Out-of-Band两种实现模型。In—Band模型是最常用的虚拟化形式,通过主机服务器和存储设备之间的存储区域在数据路径中插入存储抽象层,用虚拟存储控制设备中的管理软件来管理和配置存储设备,数据和控制信息使用同一条通路。这种方法可以节省硬件投资,但是在虚拟存储控制设备处容易造成网络拥塞而形成系统瓶颈,降低性能。在实际应用中这种结构常采用冗余配置,以避免单点故障。Out-of-Band模型中,数据和控制信息使用不同的传输通道,应用服务器的I/O命令先通过专用命令通路传送至专用的元数据服务器或控制器,获得元数据和数据视图后,再直接通过数据通路得到所需数据。整理因此减少了网络延迟,增加了带宽的可升级性,从而提高了系统性能。这种结构可避免系统的单点故障和瓶颈,但是在一定程度上增加了用户的投资。

  存储虚拟化可以在服务器、存储设备或在专用设备上实现。基于服务器端的实现是将虚拟化层放在应用服务器上,通过改造操作系统或者加上虚拟层来实现映射工作,这种方法不需要额外硬件。基于存储设备的方案是将虚拟化层放在存储设备的适配器或控制器,这种方法在理论上性能最优,能充分考虑存储设备的物理特性,并将应用服务器从虚拟化存储的实现工作中彻底解放出来,方法简单。

  由于存储网络本身是系统中的一个专用的网络,所以可通过在存储区域网络这一级采用智能化的存储路由器、存储交换机,或者增加一个元数据服务器等来实现虚拟化的工作。

  (二)IP存储技术

  2003年2月11日.IETF通过了由IBM、思科共同发起的iSCSI标准。iSCSI是一个供硬件设备使用的,可以在IP协议的上层运行的SCSI指令集。使其能够在诸如高速千兆以太网上进行路由选择,能够通过标准互联网协议(IP)传输数据和信息。

  由于iSCSI技术是基于IP协议的,能容纳所有IP协议网络中的部件,因此,用户可以在任何需要的地方创建实际的SAN网络,而不需要专门的光纤通道网络在服务器和存储设备之间传送数据。同时,因为没有光纤通道对传输距离的限制。IPSAN使用标准的TCP/IP协议,数据即可在以太网上进行传输。

  采用iSCSI技术组成的IPSAN可以提供和传统FcSAN相媲美的解决方案。而且普通服务器或PC机只需要具备网卡,即可共享和使用大容量的存储空间。与传统的FCSAN相比,IPSAN技术简单、低成本的特色相当明显。在10Gb以太网环境下,完全可以与FcSAN在交换性能上一争高低。

  (三)存储集群系统

  集群存储系统的基本原理是,所有的设备被整合到一个虚拟的存储池,组成一个透明化的全局文件系统,整个集群系统只能分配到一个驱动器盘符。这样不仅可以提高磁盘资源的利用率;还增加了服务器共享数据的能力,避免了因相同文件被重复备份而造成的不必要的资源浪费。

  两台控制器耦合在一起,互为冗余。如果其中一台设备发生了故障,另一台将会自动顶替上,维持业务的连续性,这就是最简单的集群形式。active—passive工作模式的冗余双控制器配置方案,两台控制器中总有一台一直处于备用状态,从控制器并不会分担主控制器的工作负载,而且系统容量是无法扩展的。active—active工作模式下,在两台控制器之间可以实现双向的失效切换和负载均衡分配。

  存储集群主要有两大类:一类是集群文件系统。一类是建立在集群的架构之上的独立硬件设备。目前,开发集群文件系统软件有IBM、Ibrix、PolyServe、RedHat、SGI和Vefitas等公司。它们都是基于主机的应用软件,可将SAN网络中分布的服务器集群在一起,提供一个统一的管理界面。从而能够支持多厂商的存储设备,保护用户的原有投资。相比之下,如果采用硬件集群系统的话,就需要添置新的硬件设备,费用比较大。

  (四)网格存储技术

  网格存储是网格技术发展的重要组成部分。它将存储和存储引擎整合成内部相连的网格,通过网络以一种灵活的、透明的方式分配资源,依照单位的存储策略和程序高效地管理存储资源,以保护大容量信息资产的安全。

  网格存储具有以下特点:1.模块化存储数组;2.共通管理,可以处理所有节点上数据资源,包括数据保护、资料行动化与移植以及供应与需求的分配;3.共通整理虚拟层,这是逻辑资源池,可支持用户的各种动态交互服务;4.简化平台与管理架构。总之,网格存储能很好地解决各类资源的自动优化,自动配置,自我保护和自动恢复等功能。这显然是媒体资产管理中所追求的目标。

  网格存储是以节点之间的备份为基础,可以在多重节点上进行内容管理与储存,也可以在存储环境上的多重节点进行资料转移与传输。既可应用于SAN环境,又可应用于NAS环境。可以将不同的管理工具、不同的存储应用融合在一起,兼容不同的网络协议,支持不同的系统平台,在各个分布系统上运行而且同步。对于容量、性能、服务质量和连接协议的可升级性,远远超出当前有限的虚拟化实现途径。

  三、结论:

  市场的需求带动了商业的发展,从而也大大促进了技术的更新。例如:思科提出的自防御网络概念、智能存储网络;IBM提出的存储网络容灾备份解决方案;安捷伦科技为存储网络推出4Gbit/sPCIExpress光纤通道控制器、业内第一款4GB/S光纤通道控制器芯片。网络存储也正朝着虚拟化、集群化的方向发展,但还没有得到推广与完善。尚待解决的问题有:NAS存储性能较低、存储量过大、降低局域网的性能、SAN的实际局限和地理范围拓展的矛盾等。