探索中国CIO人才现状 | 第四季调研报告
应该在节点上部署自动化关键应用的故障转移吗?
2015-05-11  来源:techtarget

当数据中心结点出现故障,应用程序需要尽可能快的重新启动。

IT组织需要一套系统实现故障转移,将一个结点转移到另一个结点,使服务重新恢复。手动干预会减慢这一流程的速度——特别当结点在半夜或假期出现问题时。

最关键的应用程序通常都会以守护进程或服务方式实现——他们会在计算机启动时自运行动。这种情况下,故障转移应该启动那些安装了应用程序的虚拟机。虚拟化能够让运行虚拟机的任何应用程序使用这样的故障转移技术。

有时候应用程序不仅仅需要重启操作系统。不是服务的应用程序,需要用户登录到虚拟机系统上,并获取应用程序备份。这样的问题通常都只会发生在Windows服务器上。设置自动登录与启动应用程序也是比较容易的,但某些特定的应用程序,还需要用户在应用程序可以再次运行前点击按钮或打开菜单。

自动化应用程序故障转移同样可能在这种情况下使用。我使用AutoIT脚本来自动化故障转移后的应用程序启动。脚本是好东西,但这种类型的自动化是脆弱的:应用程序的每个版本升级都可能导致脚本失效。

最大的问题在于那些无法非正常关闭的应用程序。这类应用程序需要完整的关闭流程,非计划的关机可能导致异常关闭,无法实现故障转移。

一般情况下,这些应用程序需要进一步人工干预,例如列出并移除每个数据库锁。自动化这些应用程序修复的告警通知,会比自动化修复这些问题来的容易。