Mailing-List: contact user-help@hbase.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@hbase.apache.org
From: Pankaj kr <pankaj.kr@huawei.com>
To: "user@hbase.apache.org" <user@hbase.apache.org>
Subject: Region server getting aborted in every one or two days
Thread-Topic: Region server getting aborted in every one or two days
Thread-Index: AdGEzsxaEe086UYyQECxdSQdnFJhKA==
Date: Wed, 23 Mar 2016 06:40:50 +0000
Message-ID: 
 <74ECFFA8DC3B6847888649793C770FE0A2D67B62@blreml510-mbs.china.huawei.com>
Accept-Language: en-US, zh-CN
Content-Language: en-US
Content-Type: multipart/alternative;
	boundary="_000_74ECFFA8DC3B6847888649793C770FE0A2D67B62blreml510mbschi_"
MIME-Version: 1.0

--_000_74ECFFA8DC3B6847888649793C770FE0A2D67B62blreml510mbschi_
Content-Type: text/plain; charset="us-ascii"
Content-Transfer-Encoding: quoted-printable

Hi,

In our production environment, RS is getting aborted in every one or two da=
ys with following exception.

2016-03-16 13:57:07,975 | FATAL | MemStoreFlusher.0 | ABORTING region serve=
r xyz-vm8,24502,1458034278600: Replay of WAL required. Forcing server shutd=
own | org.apache.hadoop.hbase.regionserver.HRegionServer.abort(HRegionServe=
r.java:2055)
org.apache.hadoop.hbase.DroppedSnapshotException: region: TB_WEBLOGIN_20160=
3,060,1457916997964.06e204d3bc262b72820aa195fec23513.
                at org.apache.hadoop.hbase.regionserver.HRegion.internalFlu=
shCacheAndCommit(HRegion.java:2423)
                at org.apache.hadoop.hbase.regionserver.HRegion.internalFlu=
shcache(HRegion.java:2128)
                at org.apache.hadoop.hbase.regionserver.HRegion.internalFlu=
shcache(HRegion.java:2090)
                at org.apache.hadoop.hbase.regionserver.HRegion.flushcache(=
HRegion.java:1983)
                at org.apache.hadoop.hbase.regionserver.HRegion.flushcache(=
HRegion.java:1909)
                at org.apache.hadoop.hbase.regionserver.MemStoreFlusher.flu=
shRegion(MemStoreFlusher.java:509)
                at org.apache.hadoop.hbase.regionserver.MemStoreFlusher.flu=
shRegion(MemStoreFlusher.java:470)
                at org.apache.hadoop.hbase.regionserver.MemStoreFlusher.acc=
ess$800(MemStoreFlusher.java:74)
                at org.apache.hadoop.hbase.regionserver.MemStoreFlusher$Flu=
shHandler.run(MemStoreFlusher.java:259)
                at java.lang.Thread.run(Thread.java:745)
Caused by: java.nio.channels.ClosedChannelException
              at org.apache.hadoop.hdfs.DataStreamer$LastExceptionInStreame=
r.throwException4Close(DataStreamer.java:208)
                at org.apache.hadoop.hdfs.DFSOutputStream.checkClosed(DFSOu=
tputStream.java:142)
                at org.apache.hadoop.hdfs.DFSOutputStream.flushOrSync(DFSOu=
tputStream.java:635)
                at org.apache.hadoop.hdfs.DFSOutputStream.hflush(DFSOutputS=
tream.java:490)
                at org.apache.hadoop.fs.FSDataOutputStream.hflush(FSDataOut=
putStream.java:130)
                at org.apache.hadoop.hbase.regionserver.wal.ProtobufLogWrit=
er.sync(ProtobufLogWriter.java:190)
                at org.apache.hadoop.hbase.regionserver.wal.FSHLog$SyncRunn=
er.run(FSHLog.java:1342)
                ... 1 more

I don't see any error info at HDFS side at that point of time.
Have anyone faced this issue?

HBase version is 0.98.6.

Regards,
Pankaj

--_000_74ECFFA8DC3B6847888649793C770FE0A2D67B62blreml510mbschi_--