冗灾系统的网络切换技术方案
冗灾系统的网络切换技术方案 网络切换技术方案目前,在业务级容灾中,网络切换方案主要有四种。(1)、3DNS所有的应用需根据主机名来访问,而不是直接根据主机的IP 地址来访问。在所有的Client 端上
冗灾系统的网络切换技术方案 网络切换技术方案
目前,在业务级容灾中,网络切换方案主要有四种。
(1)、3DNS
所有的应用需根据主机名来访问,而不是直接根据主机的
IP 地址来访问。在所有的Client 端上设置2个DNS 服务器,一主一备。系统首先查询主DNS 服务器,如果没有应答,就查询备份DNS 服务器。
生产中心和灾备中心各自安排一台3DNS 服务器,负责所
有主机的域名解析。主3DNS 服务器的内容都是和备份3DNS 服务器的自动保持完全同步。对于每个应用服务器的域名,可以保存两个IP 地址,主IP 地址指向生产中心服务器的IP 地址,备份IP 地址指向灾备中心服务器的IP 地址。3DNS 服务器可以通过PING 等方式定期检查这两个IP 地址对应的服务器的存活状态。
当生产中心的主服务器出现故障,3DNS 服务器发现无法
联系到主服务器时,会自动将DNS 请求解析至灾备中心服务器的IP 地址,从而实现单个应用的自动切换。
当生产中心发生火灾、地震等灾难,导致整个生产中心不
可用时, 客户端因为联系不上主DNS 服务器, 会自动向地址解析的请求发往备份DNS 服务器. 备份DNS 服务器通过存活状态检查确认生产中心的主服务器已经不可用, 就将灾备中心的服务器IP 地址作为DNS 应答, 从而将所有应用切换到灾备中心.
为了确保不发生误操作, 也可以不采用自动方式, 全部采用
手工方式切换. 在3DNS 服务器上, 对于每个应用服务器的域名, 只保存一个IP 地址. 当某台应用服务器不可用时, 手工对
,DNS 服务器上的对应记录进行修改, 使它指向备份中心的服务器IP 地址.当生产中心发生灾难时,手工将备份3DNS 服务器上的配置进行更改,将域名全部指向备份中心服务器的IP 地址.
当客户端将名字解析为IP 地址后,一般来说这个对应关系会在本地的Cache 里保存一段时间,在这段时间内,如果需要再次访问这个主机,则不重新向DNS 服务器发送请求,而代之以本地Cache 里的信息。所以,采用这种方式要合理设置DNS 服务器上的time-out 参数,以免在灾难发生后的很长一段时间内,服务器仍试图向原主机发送业务请求。我们建议将time-out 参数设置为5分钟.同时,客户端必须直接向生产中心或灾备中心的DNS 服务器请求地址解析,而不经过外部DNS 服务器,因为外部DNS 服务器的time-out 参数设置我们是无法控制到的.如果必须通过外部DNS 服务器来解析,则为了清除Cache 里的信息,需要手工清除或者重启机器,工作量比较大.
这种方式需要在生产中心和灾备中心各添加一台3DNS 服务器.
(2)、Routing NAT
在灾备中心的服务器接入交换机上作基于目的地址的
NAT 转换,这时从生产中心的服务器来看,灾备中心的服务器是另一个不同的IP 地址,这样可以进行数据交换;而从客户端来看,生产中心和灾备中心的服务器是同一个IP 地址,任何一个都可以进行访问。
这种方式的优点不需要添加任何设备,比较适合整个子网的切换.缺点是对于单个应用服务器的切换控制起来很不灵活,对网络结构的依赖比较大,不利于今后的扩充.
(3)、L4/7 SWITCH
将Layer4交换机放置在生产中心和灾备中心的核心交换
,机的前端.对于客户端来说,访问的始终是一个虚拟地址,这个虚拟地址由Layer4交换机进行判断解析,始终将之映射到现在正常工作的服务器上。
考虑到负载及冗余性问题,如果采用这种方法,应该在生产中心和灾备中心各配置2个Layer4交换机。
这种方法能对整个子网和单个应用进行切换. 缺点是需要添加4台Layer4交换机,投资比较大.另外,由于BMCC 生产中心和灾备中心的数据流量非常大,4层交换机很容易成为整个网络系统的瓶颈.
(4)、IP STANDBY
在正常的时候,生产中心和灾备中心使用不同的IP 地址空间,一旦发生灾难,管理员手工调整网络设置和灾备中心的IP 地址设置(灾备中心使用原生产中心的IP 地址空间),使应用恢复。
这种方法的缺点是,只适合整个子网的切换,不适合单个应用的切换.并且,目前有的应用系统在安装的时候和主机IP 地址进行了绑定,不允许改变IP 地址.其次,对于拥有大量服务器系统的灾备中心来说,手工更改IP 地址和网络配置需要较长时间.当生产中心恢复时,将网络切换回生产中心又需要大量工作。
(2)比较和选择
以上四种网络恢复技术方案的比较如下:


比较说明:
(1)3DNS
该方案需要对应用程序做一定的修改,将目前所有通过直接IP 访问的应用程序更改成通过主机名访问的方式。
该方案存在客户端CACHE 的超时问题,即灾难发生后,在超时时间内,客户端可能仍试图连接原来映射的生产中心IP 地址,导致连接不通。但可以改变DNS 服务器中设置来调整,时间越短则带宽消耗越大,可以设置为5分钟。同时各客户端都采用生产中心和灾备中心的3DNS 服务器来进行地址解析.DNS 方案的一个优点是切换时可以单个应用切换,也可以整个子网一起切换。
(2)Routing NAT
技术上虽可行,但方案的实施对网络结构的依赖较大, 且导致网络IP 规划和网络设置上非常复杂,以后网络维护将带来很大难度。只适合于整个子网切换。
(3)L4/7 Switch
,需要在主备中心增加各增加2台4层交换机,设备投资很大。同时四层交换机容易形成网络瓶颈.
(4) IP Standby
即手工修改IP 地址的方案,该方案需要临时修改主机地址、修改网络配置、启动应用系统,切换工作量大。要求同一个子网的设备一起切换。
但子网内设备数量较多的时候, 切换的时间比较长。