中星网络详解:企业级灾备中心和数据恢复介绍汇总
中星网络中星网络详解:企业级灾备中心和数据恢复(一)数据中心的容灾备份和业务连续对公司来说有多重要? 我们来看看国外在这方面的一 些统计吧:金融业在灾难停机两天内所受损失为日营业额的50;如果在两星期

中星网络
中星网络详解:企业级灾备中心和数据恢复(一)
数据中心的容灾备份和业务连续对公司来说有多重要? 我们来看看国外在这方面的一 些统计吧:金融业在灾难停机两天内所受损失为日营业额的50;如果在两星期内无法恢复信息系统,75的公司将业务停顿,43的公司将再也无法开业; 没有实施灾难备份措施的公司60将在灾难后2-3年间破产。由此可见灾难恢复对公司正常运行的重要性、必要性和迫切性。
实施数据中心的容灾备份,是企业业务持续运作的要求、同时也是企业规避风险健康发展、进行全球化战略发展和布局、成为世界级企业的要求。也是
行 业监管政策的必要措施。2007年7月,国家标准《信息系统灾难恢复规范》(GB/T20988-2007)出台,并于2007年11月1日开始正式实 施。
企业的业务连续管理包含的内容如下图所示。
DRP(Disaster Recovery Plan)灾难恢复预案是IT 的关注点,负责灾难发生时IT 系统的恢复。BCP 业务连续性计划关注灾难后企业业务的持续运作,如银行网点在银行信息系统灾 难后的恢复正常营业。业务连续管理的内容还包括供应链管理,安全管理,突发事件管理。本文要介绍的是灾难恢复计划(DRP)的相关内容。
根据灾难恢复的保护级别和数据丢失程度不同,国家标准将信息系统灾难恢复划分为六个等级,如下图。

中星网络
灾难恢复等级是基于对灾难恢复七要素的不同要求来定义的,灾难恢复的七大要素如下图。


中星网络

中星网络
中星网络详解:企业级灾备中心和数据恢复(二)
如果灾难恢复要达到六级的保护等级,灾难恢复七要素需要达到如下图所示的要求。

中星网络
国家标准中的灾难恢复预案框架(DRP)包含的内容有:
1 目标和范围。
2 组织和职责。
3 联络和通信。
4 紧急响应流程:灾难预警; 人员疏散; 损害评估; 研判和灾难宣告。 5 恢复和重新继续运行流程:恢复; 重续运行。
6 灾后重建和回退。
7 预案的保障条件。
8 附录:人员疏散计划; 产品说明书;IT 系统标准操作流程; 服务级别协议; 资源清单; 预案保存和分发方法; 业务影响分析报告。
其中附录中的业务影响分析报告是设计灾备中心时的最初着手点,业务影响分析报告从各个应用的重要性不同出发,判断对各应用采取什么样的等级保护并设计出方案。

中星网络
开发DRP 的各个工作阶段如下图所示(流程由左至右) 。
灾备中心的设计有几个很重要的灾难恢复业务参数:RTO(Recovery Time Objective) 时间恢复目标;RPO(Recovery Point Objective)恢复点目
标;NRO(Network Recovery Objective)网络恢复目标;RAO(Recovery Access Objective) 访问恢复目标。
RTO 时间恢复目标是指发生灾难后恢复物理系统环境的时间,例如服务器重启、数据库重启、数据恢复、应用回归正常运行。
RPO 恢复点目标,指灾难发生前最后一次备份的时间即数据丢失量标准,灾备中心和数据中心的距离会影响RPO 值,同城时应为零,异地距离较远时则应控制在分钟级水平。
NRO 网络恢复目标是灾难发生后的网络恢复时间,即用户在灾难后可以连接到灾备中心的时间。
RAO 访问恢复目标指验证业务能正常运行的时间,如以银行为例,在向客户和最终用户发布灾难恢复环境以恢复服务/运作之前,银行服务员应可以像用户那样登陆和正确执行交易。
下面是一个银行客户的灾难恢复业务影响分析。银行客户大约有60个应用,关键应用需要同时运行在主机和开放平台上。根据业务的保护性要求不同将业务分为三类,如下图。


中星网络
Ⅰ类是银行面向客户的业务,含24×7小时、8×7小时两种;Ⅱ类为银行的外部链接和批处理业务等;Ⅲ类为银行内部办公和管理系统应用。其中Ⅰ类和Ⅱ类应用需要第6级(无数据丢失) 灾难恢复支持,Ⅲ类应用需要第5级或第4级灾难恢复支持。
银行的部分应用分类如下图。


中星网络
中星网络详解:企业级灾备中心和数据恢复(三)
根据应用的分类和灾难恢复等级确定RTO 、RPO 等参数指标,如下图。图中包含灾备中心和数据中心同城,异地两种情况。
从RTO 目标来确定数据备份需求和连接需求,根据RTO 目标不同设计的三个方案如下图。随着RTO 值要求降低,一些应用的连接需求FC(Fiber Channel)值也降低,部分应用的复制方式也不一定需要同步进行。


中星网络
灾难备份中心建设的技术实现主要包含高层模式、数据复制、客户端切换、灾备中心建设和互联。
* 高层模式
高层模式包括冷备、暖备/热备、双活。
数据中心冷备份示意图如下.
冷备模式的灾备中心平时不启用,当数据中心发生故障时才会启用。由于


平时不怎么使用,相对成本高,冷备模式的灾备中心现在应用较少,用户考虑
,中星网络
建 冷备模式的灾备中心时很多也是采用的外包方式,将灾备中心外包给灾备服务提供商,当灾难发生时,要求灾备服务提供商启用灾备中心。
数据中心暖备份/热备份示意图如下.
上图中有DC1、DC2两个数据中心,他们各自既是数据中心也是灾备中心。DC1是应用1的数据中心同时也是应用2的灾备中心,DC2是应用2 的数据中心和应用1的灾备中心。当用户访问应用1时,DC1正常时连接到DC1,如DC1出故障则连接到DC2。DC1、DC2的主机配置、网络配置、人 员配置等基本相同,这样当某一中心出故障时,整体的运营维护不会有跟不上的情况。
双活模式的数据中心网络架构如下图。

