探索中国CIO人才现状 | 第四季调研报告
灾难恢复托管?两大问题必须看清
2016-03-08  来源:techtarget

任何有关数据中心灾难恢复的讨论几乎都会涉及到异地设施的问题。企业在灾难恢复设施的选择面很广,从传统的,非全权托管,到完全基于云的全权托管。实际取决于业务具体需求和能力。作为灾难恢复的增值项,需要更加重视灾难恢复需求、合规性以及持续测试。

IT规划中最具挑战性和复杂度的方面是准备应对数据中心和业务处理不可避免的灾害。传统的灾难恢复方法,如远程备份和复制,任然可以发挥作用,但IT组织现在开始向外寻找更好的方式来应对基础设施遭受严重破坏的情况。主机托管已经成为有吸引力的选择之一,因为企业基本上可以复制主数据中心到外地。灾难恢复托管设施可以在问题出现时及时介入,只有一点或根本没有中断造成的麻烦。

但托管不是一个可快速上手或简单的方案。让我们思考选择灾难恢复托管时需要解决的两个重要问题。

Q. 在寻找灾难恢复主机托管场所时该注意哪些?

底线是,托管的选择必须“可用”。可以根据一些因素评估潜在的托管提供商。

评估物理位置,选择地质学、政治和经济角度都比较稳定的地方。如果你计划进行服务器托管,需要提供设备和人员,就必须考虑到当地是否有可用的技术院校以及IT产业相关的人才。

评估托管设施的可达性与资源稳定性。例如,选择拥有多个独立电、长期可靠的现场放电机以及拥有多个独立连接选项,如电信运营商和互联网服务供应商。如果建筑依赖于河水或湖泊进行冷却,需要选择全年水源稳定的区域。

不要忽视安全性。业务数据始终依赖于物理硬件是否安全。这意味着托管商应提供足够的安全措施,以制约和监督进出建筑物和设备区域的人。

知道谁会接听你的电话请求,并能够理解流程和快速解决问题。最好的托管设施不会总让你留下语音邮件或者对电子邮件消息置之不理。查看供应商所有权历史,看看业务是不是经常易手。每个管理级变更都会给业务和其他租户带来政策、服务和成本变化,所以管理层的长期稳定对供应商来说是个积极的迹象。

考虑灾难恢复支持的人员和社会因素。如果你采用传统的,非全权托管的供应商,就必须时不时的确保设备与员工都在供应商处进行处理。在灾难情况下,工作人员实际上可能只有你自己的业务团队。

虽然有很多问题会被视为供应商责任,但供应商是你的业务合作伙伴。凡事可以威胁到供应商的情况,都可能中断灾难恢复的准备并可能导致合规性问题。无主机托管供应商会提供因停机时间造成损失的赔偿,但不会承诺宕机恢复的时间,所以用户需有责任进行充分的调查,确认供应商的长期物理与技术资源以及问题处理能力。

Q. 托管提供商离主数据中心应该有多近?

这个问题的答案取决于你想战胜的灾难场景。如果想法是防止本地水灾或火灾造成的设施损坏,举例来说,可以从危险区域外的众多经济托管供应商处进行选择。但是,如果你需要预防大规模灾难,灾难恢复托管站点就需要选择更远离主设施的地方。

工作负载性能需求和员工差旅费往往决定了托管的距离。距离也意味着信号延迟,所以离主数据中心越远的托管站点,通过网络传输本地与托管站点之间数据的耗时也越长。

假设故障切换灾难恢复托管站点是与主要用户相距很远的地方,那么用户体验可能会变慢。网络瓶颈、转换配置以及ISP流量水平可能会进一步影响故障切换站点与最终用户直接的网络问题。

异步与一般性业务通常对延迟没有太高要求,但很多高端企业应用,如交易或实时工作负载,对网络异常敏感。这可能使得难以同步远端站点数据集,并且电位干扰可能是潜在的数据丢失风险。了解业务是如何处理数据需求的,并选择一个托管站点,要能足够遥远,防范所需要避免的灾难——同时也要足够接近,最小化等待时间。

权衡托管距离对IT员工的影响。无管理的托管机房可能会需要在灾难期间排除员工进行常规设备安装、更换与维护。