一个oracle11g老库构建跨机房低带宽adg备库的过程记录

2021年5月27日 1205点热度 0人点赞 0条评论

某项目一个11g的老库集群3节点已运行多年,目前有一个adg备库用于读写分离。由于使用的老存储已无法扩容,主磁盘组空间捉襟见肘,不得已借用多次FRA的空间用于扩容表空间。
为临时解决空间不足的现状,临时申请1台物理主机新构建adg用于替换原有adg备库,释放存储给主集群。
新申请的主机测试不充分,后期发现与主集群之间带宽仅有50-60MB/s,为后期实施带来了困难,同时新主机未能提供同版本的CentOS6.5,而是7.4,也为后续实施造成了麻烦,尽管解决掉了问题,但是不得不说,这些时间浪费成本也不低。
本次采用duplicate的方式在线创建备库,所以不需停止主库集群,拷贝的是物理文件,理论上只会对主库集群的存储的整体io性能形成一定影响,正常是可以忽略不计的,但是如果原存储整体io负荷已经较高,那么会对某些大io的应用造成一定的影响。
但是同步期间白天一直在观察主集群,主库集群的性能并没有问题,监控显示应用一切正常,夜间并没有观察性能情况,但是项目反馈有晚间的后台接口数据汇总等应用变慢,因此怀疑存储整体io等待已经比较高,这个可以通过awr报告进行确认。
以下是具体的实施步骤概要,记录于此,以供参考。

一、修改主备机的/etc/hosts文件

二、定义主备库

包括db_unique_name、db_name、instance_name、service_name
我的实施习惯是,为简单、易于理解计,只db_unique_name设置为唯一,其他几个值主备库保持一致即可

三、确认主库的归档模式

select LOG_MODE,OPEN_MODE,FORCE_LOGGING from v$database;
确认主库处于归档模式,且强制归档。

四、在主库创建备库参数文件并拷贝到备库

此处由于已有备库,则直接把已有备库的配置文件简单修改即可
同时配置里面的相关路径,需要事先建好,尤其是11g,需要事先建好datafile/tempfile/onlinelog/controlfile等相关目录,否则会遭遇ORA-17628错误!

五、备库启动到nomount状态

六、主库密码文件拷贝到备库

七、配置主库及备库的tnsnames.ora

由于备库日志应用是基于tnsnames连接,所以需确保tnsping那几个service可用
【注:即使是RAC环境,也只需配置oracle用户的tnsnames.ora】
配置adg节点时,为使nomount的数据库可以远程连接,10G之前只能使用静态注册,10G之后除了使用静态注册之外,还有个更简单的方法,就是在TNS配置中加入UR=A选项即可,即使服务状态是BLOCKED。这对于连接到Auxilary instance的时候非常有用,否则只能采用OS认证方式。如下所示

JKDBADG2 =
  (DESCRIPTION =
    (ADDRESS = (PROTOCOL = TCP)(HOST = 10.209.xx.xx)(PORT = 1521))
    (CONNECT_DATA =
      (SERVER = DEDICATED)
      (SERVICE_NAME = jkdb)
      (UR=A)
    )
  )

用这个方法以后,即无需专门配置静态监听了,用系统默认的监听配置即可!

八、测试主机连通性

主备库都要执行,确认均可以免密登录成功
sqlplus sys/passwd@JKDB as sysdba
sqlplus sys/passwd@JKDB1 as sysdba
sqlplus sys/passwd@JKDB2 as sysdba
sqlplus sys/passwd@JKDB3 as sysdba
sqlplus sys/passwd@JKDBADG as sysdba
sqlplus sys/passwd@JKDBADG2 as sysdba

九、修改主库

此处只需修改3个参数即可,无需重启数据库

alter system set log_archive_config='DG_CONFIG=(jkdb,jkdbadg,jkdbadg2)' scope=both sid='*';
alter system set log_archive_dest_3='service=jkdbadg2 lgwr sync valid_for=(online_logfiles,primary_role) db_unique_name=jkdbadg2' scope=both sid='*';
alter system set log_archive_dest_state_3=defer scope=both sid='*';
--alter system set log_archive_dest_state_3=enable scope=both sid='*';

十、备库恢复

2T多的数据库,这一步耗时11小时,由于主库空间受限,归档日志保留时间受限,所以同时将恢复期间的归档另存下来,以备后续可能使用,由于期间涉及的归档达到800多个,只能在删除前迅速保存在一个可用位置,并及时另存,以免同时被清理掉。这800多个归档的保存脚本,花费好几个小时!还好我用比较易用的文本编辑工具,给我省了不少时间。
恢复完毕以后的日志同步、apply又执行了6、7个小时才达到了realtime apply状态。
在此也吐槽一下oracle的这个同步过程不够合理,在duplicate时并未同步传输归档,只在duplicate完毕才开始同步duplicate开始时就拉下的归档!如果在duplicate一开始就同步传输归档,会省却这个手动备份脚本的编写和执行过程。

后附,新备库jkadg2初始化同步期间的网络流量、磁盘流量统计情况

----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system--
usr sys idl wai hiq siq| read  writ| recv  send|  in   out | int   csw 
  0   0 100   0   0   0|   0    24k|  56M  769k|   0     0 |  28k   29k
  0   0 100   0   0   0|   0     0 |  57M  774k|   0     0 |  27k   29k
  0   0 100   0   0   0|   0    16k|  56M  647k|   0     0 |  20k   24k
  0   0 100   0   0   0|   0     0 |  55M  681k|   0     0 |  22k   25k
  0   0 100   0   0   0|   0     0 |  56M  663k|   0     0 |  21k   24k
  0   0 100   0   0   0|   0    16k|  56M  686k|   0     0 |  23k   25k
  0   0 100   0   0   0|   0     0 |  56M  739k|   0     0 |  26k   29k
  0   0 100   0   0   0|   0   581k|  56M  621k|   0     0 |  19k   23k
  0   0 100   0   0   0|   0    16k|  55M  670k|   0     0 |  22k   25k
  0   0 100   0   0   0|   0     0 |  56M  655k|   0     0 |  21k   24k
  0   0 100   0   0   0|   0     0 |  54M  678k|   0     0 |  23k   26k
  0   0 100   0   0   0|   0    16k|  51M  729k|   0     0 |  27k   29k
  0   0 100   0   0   0|   0     0 |  52M  787k|   0     0 |  30k   32k
  0   0 100   0   0   0|   0     0 |  50M  654k|   0     0 |  21k   26k
  0   0 100   0   0   0|   0    16k|  55M  712k|   0     0 |  24k   27k
  0   0 100   0   0   0|   0     0 |  56M  715k|   0     0 |  24k   27k
  0   0 100   0   0   0|   0     0 |  56M  760k|   0     0 |  27k   30k
  0   1  99   1   0   0|   0  1210M|  56M  703k|   0     0 |  25k   27k
  0   0 100   0   0   0|   0     0 |  55M  737k|   0     0 |  25k   28k
  0   0 100   0   0   0|   0     0 |  56M  760k|   0     0 |  26k   29k
  0   0 100   0   0   0|   0    16k|  55M  869k|   0     0 |  30k   32k
  0   0 100   0   0   0|   0     0 |  55M  731k|   0     0 |  26k   29k
  0   0 100   0   0   0|   0     0 |  55M  706k|   0     0 |  25k   29k
  0   0 100   0   0   0|   0    40k|  55M  719k|   0     0 |  23k   27k
  0   0 100   0   0   0|   0     0 |  56M  837k|   0     0 |  32k   34k
  0   0 100   0   0   0|   0     0 |  52M  769k|   0     0 |  29k   32k
  0   0 100   0   0   0|   0    16k|  49M  685k|   0     0 |  24k   28k
  0   0 100   0   0   0|   0   230M|  51M  667k|   0     0 |  23k   26k
  0   0 100   0   0   0|   0   168M|  53M  740k|   0     0 |  26k   30k

liking

这个人很懒,什么都没留下

文章评论