hbase-user-zh mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From "sudo rm -rf /*" <leo9...@qq.com>
Subject hbase 主备集群同时开启replication后WALs目录越积越大
Date Wed, 22 Jul 2020 01:50:52 GMT
hi:
&nbsp; &nbsp; 我们线上集群的版本是cdh6.3.2-hbase2.1.0, 主备双集群,备集群作为容灾集群。两集群开启了replication,且互相replication。最近发现,主集群的WALs目录持续增加,
十几天膨胀到十几个T,排查后发现某一个RegionServer节点的replication延迟很大,复制队列中积累了大量的数据,延迟卡在了十几天前的WALs
log,我们通过重建peeer,重启集群,这部分积累的WALs才
被移动到oldWALs目录中,然后被清除了。重启完集群,replication的延时没了,但现在依然发现,WALs持续在增加,但此时replication的状态是正常的。




与之对应的是备集群的oldWALs目录持续膨胀,不会被清除,实在不知道这样的问题该如何去分析,我们开启replication的过程参考的是官网的步骤。replication的相关参数,用的是默认的。
还麻烦张老师帮忙看一下,该怎么去分析这个问题。
Mime
  • Unnamed multipart/alternative (inline, 8-Bit, 0 bytes)
View raw message