探索中国CIO人才现状 | 第四季调研报告
思科提供高性能双活数据中心
2013-04-26  作者:企业网 

  从2011年7月对外公测,到2012年3月正式开放运营,不到一年的时间,盛大云已经拥有超过3万的注册用户数,成功复制了云计算的AWS(AmazonWebServices)模式。


  开启AWS模式


  2011年,盛大提出建设“盛大云”,向互联网中小企业提供包括云主机、云存储、云硬盘、云分发、云监控、数据库云及视频云在内的全产品线服务。


  2011年7月22日,盛大云正式宣布开放公测,推出按需计费的云主机、第一家面向公有云专门开发的Key-Value云存储、第一家云硬盘、第一家自助化的CDN加速产品、永久免费的云监控、以及视频云、网站云、数据库云、移动云服务等产品。


  2012年3月,盛大云取消了原有的邀请码限制,正式投入开放运营之中,开启AWS模式。据悉,其用户涵盖互联网创业者、互联网中小企业、传统行业、学校科研机构等方面。


  塑造高性能双活数据中心


  按照盛大云的规划,该平台将承载包括北京和上海两地在内的4000台服务器,对外提供约20000个左右虚拟机,以及7000个网络端口。为实现云计算服务的弹性和智能,盛大云将4000台服务器分成10个业务单元(POD),每个POD内会包括400台服务器主机、700个网络端口以及对应的存储设备,为就近企业客户提供云主机、云硬盘和云存储等云服务,并且能够实现虚拟机根据应用负荷的变化自由迁移,最大化利用系统资源。


  来自思科的专家表示,这些需求给数据中心网络提出了挑战,主要集中在POD内要求大流量业务交换、业务调度及虚拟机自由迁移、网络快速收敛、管理复杂、网络未来的扩展支持这几方面。


  首先要面对的挑战便是POD内的大流量业务交换。公有云计算平台部署的每个POD属于一个整体的业务单元,里面的云主机、云硬盘、云存储等业务交互频繁,流量大,这要求POD内网络无带宽瓶颈,无阻塞,给企业用户提供高质量保证的云服务。


  其次是业务调度及虚拟机自由迁移。为保证服务的弹性和自动化,盛大云希望能够根据业务需求的变化,快速、灵活地进行虚拟机迁移,实现资源部署及调度。但这要求有一个稳定的大规模二层组网环境,而传统的数据中心二层组网技术已无法满足要求。


  第三,网络难以快速收敛。如果采用传统数据中心组网模式,由于采用STP(生成树)协议消除环路,这将导致大量带宽浪费,无法支持服务器之间迅猛增加的横向流量;同时网络的收敛比很高,并难以快速收敛,这些都将成为数据中心的不稳定因素。


  最后的挑战来自于管理复杂,可扩展性差。传统模式下,由于生成树协议的使用,会导致每一个POD中需要管理的网元数量繁多,这会增加管理的工作量和难度,一旦遇到故障将很难快速排查;另外,在传统组网模式下,要求网络的核心层和接入层交换机都必须保持所有的虚拟机物理地址表,这使得整体网络扩展性受到极大限制。


  针对盛大公有云计算平台建设需求,思科为用户设计了高性能的双活数据中心组网解决方案。其中,网络核心部分采用2台Nexus7009,分成2个VDC使用。VDC1作为所有使用公网地址的每个VLAN的网关;VDC2则为所有物理机器管理VLAN网关。


  在每个POD业务节点内,部署2台Nexus5548交换机和15台Nexus2248交换机作为二层接入交换机。每台Nexus5548交换机分别上链8条万兆链路到每个核心Nexus7009,并运行FabricPath;每台Nexus2248交换机通过4条万兆线路分别上联2台Nexus5548,再通过48个GE端口连接下面服务器主机,总共可以提供720个服务器端口。


  借助双活数据中心,盛大云有条件实现跨地域数据中心的二层互通,真正实现多个数据中心全网内虚拟机的自由迁移。


  借力创新技术


  在盛大公有云计算平台项目中,思科引入了包括数据中心网络架构FabricPath等众多创新技术,成功地帮助盛大云解决数据中心部署挑战。


  思科专家告诉记者,FabricPath技术的引入,使得盛大云的数据中心组网方式更适合云计算要求。FabricPath使得数据中心网络不再需要运行生成树协议(STP),没有链路被阻断,多条链路均可转发数据,最大转发流量带宽高达160TB,很好地支持了服务器之间迅猛增加的横向流量。同时,FabricPath能很好支持数据中心二层网络的平滑扩展——从核心到POD全网支持虚拟机的自由迁移,彻底消除生成树。


  借助思科的FabricPath技术,可以实现POD中交换机无需学习全部的MAC地址表,在汇聚节点上,也突破了传统方式下双核心的限制,最多可以实现单个POD内容纳4个Nexus5548节点——这样彻底改写了数据中心组网规模受限的历史,随时根据盛大云未来业务的发展,动态扩展。


  同时,为了提高POD内大业务流量的快速转发要求,思科一方面借助FabricPath技术,确保主机可以通过多条链路带宽的捆绑,实现大数据量的高速传输。另外还特别采取了FEX技术,将Nexus228交换机作为Nexus5548的远程模块使用,相当于延伸了Nexus5548交换机的背板,这样做的好处是:内部线速交换,不存在带宽瓶颈以及故障单点;Nexus2248的管理和配置全部在Nexus5548上面,POD内的管理网元直接从17个缩减为2个。整个网络只需要管理22个网元,而传统方案需要148个管理网元,这将大幅降低管理的工作量和复杂度。


  而FabricPath技术和FEX等技术的引用在保证了数据中心网络的性能的同时也降低了设备的投资成本。除此之外,思科为该项目引入了高密度、大容量的Nexus7009核心交换机,专门为数据中心的云计算设计。思科专门采用48口F2万兆线速板卡,和传统核心交换机的板卡相比,单槽线速端口密度提高到6倍、每端口功耗却不到传统的25%、延时时间则缩短至传统设备的15%左右。这意味着更少空间占用和更低的功耗,从而帮助盛大云大幅降低运营成本。


  如今,时间距离2012年3月盛大云开放运营已经一年的时间,虽然尚未披露最新的数据,但从盛大云中书城、云存储和视频云等市场表现开看,盛大云依旧走得稳健。


  ■案例卡片


  客户挑战


  ·每个POD内业务交互频繁,流量大,要求网络无带宽瓶颈,无阻塞,给企业用户提供高质量保证的云服务


  ·虚拟机迁移要求有一个稳定的大规模二层组网环境


  ·生成树的限制,导致数据中心管理过于复杂,并不利于扩展


  解决方案


  ·基于FabricPath技术的思科全新数据中心网络方案、Nexus系列交换机


  实施成效


  ·FabricPath技术的引入,使得盛大网络的数据中心组网方式更适合云计算要求,消除生成树,支持大流量高速转发,并实现动态扩展


  ·大幅降低管理的工作量和复杂度


  ·更少空间占用和更低的功耗,帮助盛大云大幅降低运营成本。


  盛大云的八大特色业务


  ·云主机


  国内首家支持按小时使用的云主机,安全组自由设置功能业内领先,申请与回收Windows/Linux计算资源速度最快的国内产品之一。主机系统类型丰富。


  ·云存储


  云存储基于简易存取的Key-Value方式,提供高可靠、高可用、高性能的数据存储。


  ·云硬盘


  国内唯一的云硬盘产品,填补了国内空白。可以为云主机提供一个基于块设备的存储卷,数据高可靠,每份云硬盘数据在后台都存有多份冗余,并实时同步,保证不受单机故障影响。


  ·云分发


  国内首次颠覆传统CDN服务模式,提供自助式快捷服务。


  ·数据库云


  提供各种关系型数据库以及各种NoSQL数据库的云端服务。


  ·视频云


  视频建站、视频托管。此外,可与视频云的建站系统无缝结合,提供完整的多媒体解决方案


  ·网站云


  将云计算的资源与互联网上主流建站软件程序相结合的网站整体运营解决方案。


  ·云监控


  7×24小时监控网站,及时发现网站故障。