RAC集群两个节点负载失衡

一个重要的生产系统近期出现负载严重不均衡的情况,在业务忙时,一个节点CPU负载99%,而同时另一个节点CPU却很空闲。两个节点的活动会话如下。

可见很不正常,绝大多数会话都连到了1号节点!
再看非活动会话情况,如下。

可见大量的非活动会话,大部分都连接到了2号节点,据此再次印证了RAC集群的负载均衡机制只是简单的round-robin轮询模式,只是简单根据会话总数判断下一个连接的节点选择。本系统客户端都采用server端的load-banlance机制,因此应该确保两个节点在活动状态下,再启动weblogic等长连接应用,确保长连接应用平均分配到2个节点,这样才可以确保后续的大量短连接应用能够平均分布到两个节点!

附会话查询语句如下。

针对killed、snipped会话,应该kill session,如果kill不掉,需要kill 进程,使用如下语句。

 

《RAC集群两个节点负载失衡》有1个想法

发表评论

电子邮件地址不会被公开。 必填项已用*标注