前一阵子,花了几天时间,把之前的一个数据库容灾实施的案例,写了一篇论文,具体就不放在这里了,后续如果有完善、深化再说。
以下是部分细节:
4 网管系统容灾设计要点
4.1 数据库设计
针对网管系统各个模块的数据库建设现状,同时结合不同模块的系统特点,设计如下的数据库容灾模型要点:
1)针对告警系统、集中操作维护系统、资源管理及巡检等系统,采用A数据中心和B数据中心双中兴并行运行的方式,数据库采用IBM informix 11.5的SDS(共享磁盘阵列、负载分担技术)、HDR(高可用性数据复制技术)两项技术,结合应用层面的分布式部署技术,协同实现业务级的容灾建设模式;
2)针对性能系统、EOMS系统,采用A数据中心和B数据中心双中兴并行运行的方式,数据库采用oracle 11gR2的RAC(共享磁盘阵列、负载分担技术)、dataguard(高可用性数据复制技术)两项技术,结合应用层面的分布式部署技术,协同实现业务级的容灾建设模式;
3)针对网优系统,采用C数据中心和B数据中心双中兴并行运行的方式,数据库采用oracle 11gR2的RAC(共享磁盘阵列、负载分担技术)、dataguard(高可用性数据复制技术)两项技术,结合应用层面的分布式部署技术,协同实现业务级的容灾建设模式。
4.2 主机设计
针对目前网管系统的硬件设备情况,同时结合三个中心运营模式的需要,设计如下的三中心容灾模型要点:
1)4台HP小型机:分别放置在A数据中心和B数据中心;
2)8台IBM小型机:4台放置在B数据中心,2台放置在A数据中心,2台放置在在C数据中心,组建3个IBM小机云计算资源池;
3)20台PC服务器:10台放置在B数据中心,5台放置在A数据中心,5台放置在C数据中心,组建3个PC服务器云计算资源池。
以上具体的规划情况,参见下图“三中心主机分布示意图”。
4.3 云计算设计
实施云计算主机资源池的建设模式,可以对资源池里的所有主机进行动态的管理调控,提高主机利用率,大大降低运营及维护成本。
4.3.1 IBM小型机云计算设计
IBM的云计算开发及管理组件SKC(Starter Kit for Cloud),是针对云计算的上层包装,专门用来对云计算IaaS硬件资源池进行管理。A数据中心的2台P595,B数据中心的6台P780,C数据中心的2台P780,目前采用IBM的DLPAR技术做了众多的分区,在此之上采用VMcontrol、SKC统一管理,可以有效动态调度相关的资源,在系统架构层面得到较大的完善。
4.3.2 PC服务器云计算设计
三个数据中心的多台PC服务器,规划为三个PC服务器云计算资源池,采用浪潮云海技术设计,部署1套云海server及多个云海计算节点,在此之上建设多个Linux虚拟机,部署各类X86应用。
5 网管系统容灾实施效果
总之,通过实施网管系统容灾建设,网管支撑系统达到了预期的效果,具体表现在以下几个方面。
在数据层面,由于实施了最为先进的数据库双机及远程数据复制技术,各个网管业务数据库在同一时刻确保存在至少两份最新的数据,且分布在不同的数据中心。
在应用层面,通过实施主流的应用中间件技术和分布式部署技术,结合专业的容灾切换管理软件,实现了应用服务的异地负载均衡与实时故障切换效果,应用的切换可以控制在10分钟以内。
在业务层面,基于上述的数据层面与应用层面容灾技术的支撑,实现了如下的业务容灾效果:
1)网管业务关键模块不间断运行;
2)网管业务关键模块达到电信级可靠性。
文章评论