前不久一个系统死锁导致部分业务受到影响,今次补上详细的节点日志分析过程。 这个PXC集群有三个节点,分别是 108、109、110,日志信息的ip6地址、节点编号等信息均已做脱敏处理。 以下日志里面,3个节点对应的配置信息是: 108 99999999-9908 9999:9999:9999:9999::6c 109 99999999-9909 9999:9999:9999:9999::6d 110 99999999-9910 9999:9999:9999:9999::6e 一、节点日志分析109节点 1.1 之前…

2024年7月24日 0条评论 301点热度 0人点赞 liking 阅读全文

一、报错信息 某项目最近在 SQL Loader 导数据时偶尔会报错,类似如下: SQL loader ORA-01658 unable to creale INITIAL extent for segment in tablespace ADS5GP2P_1 这个报错的意思是,没有足够的连续空间为表或索引创建 INITIAL extent: [oracle@node1:1 ~]$ oerr ora 1658 01658, 00000, "unable to create INITIAL extent f…

2024年7月15日 0条评论 497点热度 0人点赞 liking 阅读全文

前阵子为PXC集群配置IPv6支持,遇见奇怪的问题,就是SST同步时总是报错,为此在官网论坛提交了问题,未得到答案,最后偶然得到了答案,详见官方论坛: https://forums.percona.com/t/sst-cant-support-ipv6/26140 结论如下。 Finally, I found the solution is turn off pxc_encrypt_cluster_traffic, then it works well. And this is my major part of c…

2023年11月7日 0条评论 1150点热度 0人点赞 liking 阅读全文

声明:此文来自于MOS(Doc ID 1674865.1),整理在此以便于大家阅读学习。 ■ 概要 在Oracle的RAC环境中,数据库会收集global cache 的工作负载统计信息,并把这些信息通过STATSPACK, AWRs 和 GRID CONTROL等工具呈报。对于每个节点,以及集群汇总统计信息中的global cache数据块丢失的统计信息("gc cr block lost" 和/或 "gc current block lost") 代表了私网通信的包处理效…

2023年8月24日 0条评论 1251点热度 0人点赞 liking 阅读全文

前期一个项目与外部厂商联调时,由于外部某几个网络环节存在超时或不通的情况,排查到可能需要修改部分网络环节的MSS参数信息,以下对相关操作进行记录,留待后续参考。 0、背景知识 MTU: Maximum Transmission Unit 最大传输单元 MSS: Maximum Segment Size 最大分段大小 一般以太网MTU都为1500, 所以在以太网中, 往往TCP MSS为1460 1、修改方法1---ifconfig # 默认的设置 ifconfig ens192 mtu 1500 # 改为其他值 i…

2022年6月27日 0条评论 945点热度 1人点赞 liking 阅读全文

研发人员在测试大事务提交时遇见了错误: Got error 5 - 'Transaction size exceed set threshold' during COMMIT 测试了几次都是1200S的时候停止的,不过在注释掉特定步骤后,过程还是在1200S失去连接了,不知道这个1200S的执行参数是哪个,可能这个1200s的执行参数是关键,因为看 wsrep_max_ws_size 最大提交量是2G,理论上应该是够用的。 通过以下查询方式,也只能查出这个2G的限制: show variable…

2022年6月15日 0条评论 855点热度 1人点赞 liking 阅读全文

一套2节点的MySQL PXC集群,第1节点作为主用节点长时间的dml操作,导致大量的事务阻塞,出现异常,此时查看第2节点显示是primary状态,但无事务阻塞情况。 此时第1节点无法正常提供服务,于是以为第2节点可以作为主节点提供sst数据源来新建第1节点,但清空第1节点开始启动时,却发现无法正常启动sst同步,因为:failed to reach primary view 此时的报错信息详情如下: 2022-03-16T11:28:00.546024Z 0 [ERROR] [MY-000000] [Galera…

2022年3月21日 0条评论 1102点热度 0人点赞 liking 阅读全文

某项目扩展表空间后增加了一个数据文件,出现数据库无法连接的情况,项目人员联系主机硬件厂家,对方发了几个图片说空间不足了,项目人员于是说按照对方说法在主机删除了对应数据文件,这次更无法启动数据库了,,,,,真是无知者无畏,对方敢让删数据文件,项目人员也赶删,实在是无语至极! 这个表空间已有53个数据文件,这次按序号增加的是54号数据文件,之后又在os层面执行了rm操作,且重启了主机,恢复这个文件是基本没有希望了。 查看数据库日志,如下: Fri Jan 21 16:46:00 2022 ALTER TABLESPAC…

2022年1月23日 0条评论 865点热度 0人点赞 liking 阅读全文

一个PXC 8.0.23集群,因为项目操作导致无法提供服务了,提示信息为: ERROR 1047 (08S01): WSREP has not yet prepared node for application use 或者 2013 - Lost connection to MySQL server during query 登录各个节点查看集群wsrep_cluster_size均为0,节点状态wsrep_cluster_status都不是Primary状态(好像是not connected),查看grasta…

2022年1月18日 1条评论 2739点热度 0人点赞 liking 阅读全文

这是一套11g的老库,主库3节点,备库1节点。项目上于昨天晚上做某测试扩容了表空间,在其他位置新建了9个数据文件,在备库无法创建这个非标准位置的datafile,从而导致同步中断。 第二天上午才发现数据不同步,备库的只读业务受到影响。 查看alertlog看到明显的报错 ORA-01111: name for data file 41 is unknown - rename to correct file ORA-01110: data file 41: '/u01/app/oracle/product/…

2021年8月13日 1条评论 1678点热度 0人点赞 liking 阅读全文
123456