From user-return-64338-archive-asf-public=cust-asf.ponee.io@cassandra.apache.org  Thu Aug  8 16:31:33 2019
Return-Path: <user-return-64338-archive-asf-public=cust-asf.ponee.io@cassandra.apache.org>
X-Original-To: archive-asf-public@cust-asf.ponee.io
Delivered-To: archive-asf-public@cust-asf.ponee.io
Received: from mail.apache.org (hermes.apache.org [207.244.88.153])
	by mx-eu-01.ponee.io (Postfix) with SMTP id 61487180642
	for <archive-asf-public@cust-asf.ponee.io>; Thu,  8 Aug 2019 18:31:32 +0200 (CEST)
Received: (qmail 39759 invoked by uid 500); 8 Aug 2019 16:31:29 -0000
Mailing-List: contact user-help@cassandra.apache.org; run by ezmlm
Precedence: bulk
List-Help: <mailto:user-help@cassandra.apache.org>
List-Unsubscribe: <mailto:user-unsubscribe@cassandra.apache.org>
List-Post: <mailto:user@cassandra.apache.org>
List-Id: <user.cassandra.apache.org>
Reply-To: user@cassandra.apache.org
Delivered-To: mailing list user@cassandra.apache.org
Received: (qmail 39749 invoked by uid 99); 8 Aug 2019 16:31:29 -0000
Received: from pnap-us-west-generic-nat.apache.org (HELO spamd3-us-west.apache.org) (209.188.14.142)
    by apache.org (qpsmtpd/0.29) with ESMTP; Thu, 08 Aug 2019 16:31:29 +0000
Received: from localhost (localhost [127.0.0.1])
	by spamd3-us-west.apache.org (ASF Mail Server at spamd3-us-west.apache.org) with ESMTP id 9AD95180EC2
	for <user@cassandra.apache.org>; Thu,  8 Aug 2019 16:31:28 +0000 (UTC)
X-Virus-Scanned: Debian amavisd-new at spamd3-us-west.apache.org
X-Spam-Flag: NO
X-Spam-Score: 3.252
X-Spam-Level: ***
X-Spam-Status: No, score=3.252 tagged_above=-999 required=6.31
	tests=[DKIM_SIGNED=0.1, DKIM_VALID=-0.1, DKIM_VALID_AU=-0.1,
	DKIM_VALID_EF=-0.1, FROM_EXCESS_BASE64=0.001, HTML_MESSAGE=2,
	KAM_LINEPADDING=1.2, KAM_LOTSOFHASH=0.25, RCVD_IN_DNSWL_NONE=-0.0001,
	SPF_HELO_NONE=0.001, SPF_PASS=-0.001, URIBL_BLOCKED=0.001]
	autolearn=disabled
Authentication-Results: spamd3-us-west.apache.org (amavisd-new);
	dkim=pass (2048-bit key) header.d=gmail.com
Received: from mx1-he-de.apache.org ([10.40.0.8])
	by localhost (spamd3-us-west.apache.org [10.40.0.10]) (amavisd-new, port 10024)
	with ESMTP id nS8IrEtOyWX6 for <user@cassandra.apache.org>;
	Thu,  8 Aug 2019 16:31:24 +0000 (UTC)
Received-SPF: Pass (mailfrom) identity=mailfrom; client-ip=2607:f8b0:4864:20::32c; helo=mail-ot1-x32c.google.com; envelope-from=philipcondon@gmail.com; receiver=<UNKNOWN> 
Received: from mail-ot1-x32c.google.com (mail-ot1-x32c.google.com [IPv6:2607:f8b0:4864:20::32c])
	by mx1-he-de.apache.org (ASF Mail Server at mx1-he-de.apache.org) with ESMTPS id 08FE97D3FC
	for <user@cassandra.apache.org>; Thu,  8 Aug 2019 16:31:24 +0000 (UTC)
Received: by mail-ot1-x32c.google.com with SMTP id x21so27743125otq.12
        for <user@cassandra.apache.org>; Thu, 08 Aug 2019 09:31:23 -0700 (PDT)
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;
        d=gmail.com; s=20161025;
        h=mime-version:references:in-reply-to:from:date:message-id:subject:to;
        bh=uipa6Xlw9RKjjCY4BWjpG7CG7X/+G1uAFp4uJYTP2JA=;
        b=ijO9CunfyZ9KWo7R6TStDFdMYJ91TIhyAX4UPUpj/mSJ3dxiaIZonjerBo809O9hAb
         LEElSrk+yW36ZD0eWRUsmHs5zfszlQNJ1bJpo9YPgDLqWY9c8sx9xE+ndxVovnTQdceL
         UQUg6NQF1igD5glw5MZL5k0YZZMLyMSeOL8vRURHV7uaIeOQHucT15Az8eQJm7LbSLP5
         l3MOF7UgndQ3U0eiYEQM6d/iRMBwMR0PWSBIMr+Pkd7Da8iTR9miYIGtvN5xwYBZE9Ib
         D8BMt0DV18wrCaFJXnEGo+6smpQe/VjBf+f/eYkhnzGRKJsu2z+qa3yVclN/IqH8x5iK
         TAgA==
X-Google-DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;
        d=1e100.net; s=20161025;
        h=x-gm-message-state:mime-version:references:in-reply-to:from:date
         :message-id:subject:to;
        bh=uipa6Xlw9RKjjCY4BWjpG7CG7X/+G1uAFp4uJYTP2JA=;
        b=m0DcnjuPjK7n2IMQ0sN0EVDTP6AzFhEU6xYn6I4nhkDRQ4pwkwRva6qbMf2M9MNNFj
         KDzEhxV8pjel/al23B7PZnwIc+OKOnpfukuYfVrikUiCfwv4zZL+pj0gAe+Br8C3yopQ
         VzhNlq829mezZT5CNKseZ+PUirYFabjvpa/xOP5eosL9ze1ss7loZJCb54SF7BK9h2s/
         e/8MpSOlTEgbFk4GR/cwniJRSELoW6JTpbgYATFEls5SDD/cOltfUEKAvmFVdw8oUDnU
         udKLBnkuxT0EcoIMRjTrsfhQZgymUePO0ha7WKJE9OmaPJLhGXFcq9ZjSiJYW+TX1+r/
         ZkxA==
X-Gm-Message-State: APjAAAW5qTRle8h06m+zCgIcsmtTWygqMcZFjCpSjjsvRmA3YNiH2Muv
	eVflbjbmV2kBKXM0voGqfX1kKNy+/O8IvQRs0dApM3LeQA==
X-Google-Smtp-Source: APXvYqzOqP4UTfJgP2LwLMSgTtLJadTVfbrbZD6UJM1V+TgIgTHaX1u8GQjbR85cgC3rtKW9gkfbHYJyNPPvRCvEAAM=
X-Received: by 2002:a05:6830:157:: with SMTP id j23mr14390433otp.198.1565281881761;
 Thu, 08 Aug 2019 09:31:21 -0700 (PDT)
MIME-Version: 1.0
References: <CAM8_W0YNgz1EddAQwKMvEPBw-VRc6764S9Phmz15wffNpTom7A@mail.gmail.com>
 <34D1EBF4-96A5-46B9-AA3E-46CFBF01866B@gmail.com> <84E4EDDD-69E0-452A-92B1-7ABDDE811B22@gmail.com>
 <CAM8_W0Z4ng-PWmLoyFRTAD5Lby6Q4Z_ieDEO6d7qoO7rjwD9Qg@mail.gmail.com> <053247A8CBB6754B8345743B8F18D68D525C8A85@MOSTLS1MSGUSRFA.ITServices.sbc.com>
In-Reply-To: <053247A8CBB6754B8345743B8F18D68D525C8A85@MOSTLS1MSGUSRFA.ITServices.sbc.com>
From: =?UTF-8?B?UGhpbGlwIMOTIENvbmTDumlu?= <philipoconduin@gmail.com>
Date: Thu, 8 Aug 2019 17:31:04 +0100
Message-ID: <CAM8_W0azHBBt-AcB63gf+sPEBrE2DnS2xCDOj_DsdJ6HYa5E3Q@mail.gmail.com>
Subject: Re: Datafile Corruption
To: user@cassandra.apache.org
Content-Type: multipart/alternative; boundary="000000000000892f66058f9d962c"

--000000000000892f66058f9d962c
Content-Type: text/plain; charset="UTF-8"
Content-Transfer-Encoding: quoted-printable

*@Jeff *- If it was hardware that would explain it all, but do you think
it's possible to have every server in the cluster with a hardware issue?
The data is sensitive and the customer would lose their mind if I sent it
off-site which is a pity cause I could really do with the help.
The corruption is occurring irregularly on every server and instance and
column family in the cluster.  Out of 72 instances, we are getting maybe 10
corrupt files per day.
We are using vnodes (256) and it is happening in both DC's

*@Asad *- internode compression is set to ALL on every server.  I have
checked the packets for the private interconnect and I can't see any
dropped packets, there are dropped packets for other interfaces, but not
for the private ones, I will get the network team to double-check this.
The corruption is only on the application schema, we are not getting
corruption on any system or cass keyspaces.  Corruption is happening in
both DC's.  We are getting corruption for the 1 application schema we have
across all tables in the keyspace, it's not limited to one table.
Im not sure why the app team decided to not use default compression, I must
ask them.



I have been checking the /var/log/messages today going back a few weeks and
can see a serious amount of broken pipe errors across all servers and
instances.
Here is a snippet from one server but most pipe errors are similar:

Jul  9 03:00:08  cassandra: INFO  02:00:08 Writing
Memtable-sstable_activity@1126262628(43.631KiB serialized bytes, 18072 ops,
0%/0% of on/off-heap limit)
Jul  9 03:00:13  kernel: fnic_handle_fip_timer: 8 callbacks suppressed
Jul  9 03:00:19  kernel: fnic_handle_fip_timer: 8 callbacks suppressed
Jul  9 03:00:22  cassandra: ERROR 02:00:22 Got an IOException during write!
Jul  9 03:00:22  cassandra: java.io.IOException: Broken pipe
Jul  9 03:00:22  cassandra: at sun.nio.ch.FileDispatcherImpl.write0(Native
Method) ~[na:1.8.0_172]
Jul  9 03:00:22  cassandra: at
sun.nio.ch.SocketDispatcher.write(SocketDispatcher.java:47) ~[na:1.8.0_172]
Jul  9 03:00:22  cassandra: at
sun.nio.ch.IOUtil.writeFromNativeBuffer(IOUtil.java:93) ~[na:1.8.0_172]
Jul  9 03:00:22  cassandra: at sun.nio.ch.IOUtil.write(IOUtil.java:65)
~[na:1.8.0_172]
Jul  9 03:00:22  cassandra: at
sun.nio.ch.SocketChannelImpl.write(SocketChannelImpl.java:471)
~[na:1.8.0_172]
Jul  9 03:00:22  cassandra: at
org.apache.thrift.transport.TNonblockingSocket.write(TNonblockingSocket.jav=
a:165)
~[libthrift-0.9.2.jar:0.9.2]
Jul  9 03:00:22  cassandra: at
com.thinkaurelius.thrift.util.mem.Buffer.writeTo(Buffer.java:104)
~[thrift-server-0.3.7.jar:na]
Jul  9 03:00:22  cassandra: at
com.thinkaurelius.thrift.util.mem.FastMemoryOutputTransport.streamTo(FastMe=
moryOutputTransport.java:112)
~[thrift-server-0.3.7.jar:na]
Jul  9 03:00:22  cassandra: at
com.thinkaurelius.thrift.Message.write(Message.java:222)
~[thrift-server-0.3.7.jar:na]
Jul  9 03:00:22  cassandra: at
com.thinkaurelius.thrift.TDisruptorServer$SelectorThread.handleWrite(TDisru=
ptorServer.java:598)
[thrift-server-0.3.7.jar:na]
Jul  9 03:00:22  cassandra: at
com.thinkaurelius.thrift.TDisruptorServer$SelectorThread.processKey(TDisrup=
torServer.java:569)
[thrift-server-0.3.7.jar:na]
Jul  9 03:00:22  cassandra: at
com.thinkaurelius.thrift.TDisruptorServer$AbstractSelectorThread.select(TDi=
sruptorServer.java:423)
[thrift-server-0.3.7.jar:na]
Jul  9 03:00:22  cassandra: at
com.thinkaurelius.thrift.TDisruptorServer$AbstractSelectorThread.run(TDisru=
ptorServer.java:383)
[thrift-server-0.3.7.jar:na]
Jul  9 03:00:25  kernel: fnic_handle_fip_timer: 8 callbacks suppressed
Jul  9 03:00:30  cassandra: ERROR 02:00:30 Got an IOException during write!
Jul  9 03:00:30  cassandra: java.io.IOException: Broken pipe
Jul  9 03:00:30  cassandra: at sun.nio.ch.FileDispatcherImpl.write0(Native
Method) ~[na:1.8.0_172]
Jul  9 03:00:30  cassandra: at
sun.nio.ch.SocketDispatcher.write(SocketDispatcher.java:47) ~[na:1.8.0_172]
Jul  9 03:00:30  cassandra: at
sun.nio.ch.IOUtil.writeFromNativeBuffer(IOUtil.java:93) ~[na:1.8.0_172]
Jul  9 03:00:30  cassandra: at sun.nio.ch.IOUtil.write(IOUtil.java:65)
~[na:1.8.0_172]
Jul  9 03:00:30  cassandra: at
sun.nio.ch.SocketChannelImpl.write(SocketChannelImpl.java:471)
~[na:1.8.0_172]
Jul  9 03:00:30  cassandra: at
org.apache.thrift.transport.TNonblockingSocket.write(TNonblockingSocket.jav=
a:165)
~[libthrift-0.9.2.jar:0.9.2]
Jul  9 03:00:30  cassandra: at
com.thinkaurelius.thrift.util.mem.Buffer.writeTo(Buffer.java:104)
~[thrift-server-0.3.7.jar:na]
Jul  9 03:00:30  cassandra: at
com.thinkaurelius.thrift.util.mem.FastMemoryOutputTransport.streamTo(FastMe=
moryOutputTransport.java:112)
~[thrift-server-0.3.7.jar:na]
Jul  9 03:00:30  cassandra: at
com.thinkaurelius.thrift.Message.write(Message.java:222)
~[thrift-server-0.3.7.jar:na]
Jul  9 03:00:30  cassandra: at
com.thinkaurelius.thrift.TDisruptorServer$SelectorThread.handleWrite(TDisru=
ptorServer.java:598)
[thrift-server-0.3.7.jar:na]
Jul  9 03:00:30  cassandra: at
com.thinkaurelius.thrift.TDisruptorServer$SelectorThread.processKey(TDisrup=
torServer.java:569)
[thrift-server-0.3.7.jar:na]
Jul  9 03:00:30  cassandra: at
com.thinkaurelius.thrift.TDisruptorServer$AbstractSelectorThread.select(TDi=
sruptorServer.java:423)
[thrift-server-0.3.7.jar:na]
Jul  9 03:00:30  cassandra: at
com.thinkaurelius.thrift.TDisruptorServer$AbstractSelectorThread.run(TDisru=
ptorServer.java:383)
[thrift-server-0.3.7.jar:na]
Jul  9 03:00:31  kernel: fnic_handle_fip_timer: 8 callbacks suppressed
Jul  9 03:00:37  kernel: fnic_handle_fip_timer: 8 callbacks suppressed
Jul  9 03:00:43  kernel: fnic_handle_fip_timer: 8 callbacks suppressed



On Thu, 8 Aug 2019 at 15:42, ZAIDI, ASAD A <az192g@att.com> wrote:

> Did you check if packets are NOT being dropped for network interfaces
> Cassandra instances are consuming (ifconfig =E2=80=93a) internode compres=
sion is
> set for all endpoint =E2=80=93 may be network is playing any role here?
>
> is this corruption limited so certain keyspace/table | DCs or is that wid=
e
> spread =E2=80=93 the log snippet you shared it looked like only specific
> keyspace/table is affected =E2=80=93 is that correct?
>
> When you remove corrupted sstable of a certain table, I guess you verifie=
s
> all nodes for corrupted sstables for same table (may be with with nodetoo=
l
> scrub tool) so to limit spread of corruptions =E2=80=93 right?
>
> Just curious to know =E2=80=93 you=E2=80=99re not using lz4/default compr=
essor for all
> tables there must be some reason for it.
>
>
>
>
>
>
>
> *From:* Philip =C3=93 Cond=C3=BAin [mailto:philipoconduin@gmail.com]
> *Sent:* Thursday, August 08, 2019 6:20 AM
> *To:* user@cassandra.apache.org
> *Subject:* Re: Datafile Corruption
>
>
>
> Hi All,
>
> Thank you so much for the replies.
>
> Currently, I have the following list that can potentially cause some sort
> of corruption in a Cassandra cluster.
>
>    - Sudden Power cut  -  *We have had no power cuts in the datacenters*
>    - Network Issues - *no network issues from what I can tell*
>    - Disk full - *I don't think this is an issue for us, see disks below.=
*
>    - An issue in Casandra version like Cassandra-13752 -* couldn't find
>    any Jira issues similar to ours.*
>    - Bit Flips -* we have compression enabled so I don't think this
>    should be an issue.*
>    - Repair during upgrade has caused corruption too -* we have not
>    upgraded*
>    - Dropping and adding columns with the same name but a different type
>    - *I will need to ask the apps team how they are using the database.*
>
>
>
> Ok, let me try and explain the issue we are having, I am under a lot of
> pressure from above to get this fixed and I can't figure it out.
>
> This is a PRE-PROD environment.
>
>    - 2 datacenters.
>    - 9 physical servers in each datacenter
>    - 4 Cassandra instances on each server
>    - 72 Cassandra instances across the 2 data centres, 36 in site A, 36
>    in site B.
>
>
> We also have 2 Reaper Nodes we use for repair.  One reaper node in each
> datacenter each running with its own Cassandra back end in a cluster
> together.
>
> OS Details [Red Hat Linux]
> cass_a@x 0 10:53:01 ~ $ uname -a
> Linux x 3.10.0-957.5.1.el7.x86_64 #1 SMP Wed Dec 19 10:46:58 EST 2018
> x86_64 x86_64 x86_64 GNU/Linux
>
> cass_a@x 0 10:57:31 ~ $ cat /etc/*release
> NAME=3D"Red Hat Enterprise Linux Server"
> VERSION=3D"7.6 (Maipo)"
> ID=3D"rhel"
>
> Storage Layout
> cass_a@xx 0 10:46:28 ~ $ df -h
> Filesystem                         Size  Used Avail Use% Mounted on
> /dev/mapper/vg01-lv_root            20G  2.2G   18G  11% /
> devtmpfs                            63G     0   63G   0% /dev
> tmpfs                               63G     0   63G   0% /dev/shm
> tmpfs                               63G  4.1G   59G   7% /run
> tmpfs                               63G     0   63G   0% /sys/fs/cgroup
> >> 4 cassandra instances
> /dev/sdd                           1.5T  802G  688G  54% /data/ssd4
> /dev/sda                           1.5T  798G  692G  54% /data/ssd1
> /dev/sdb                           1.5T  681G  810G  46% /data/ssd2
> /dev/sdc                           1.5T  558G  932G  38% /data/ssd3
>
> Cassandra load is about 200GB and the rest of the space is snapshots
>
> CPU
> cass_a@x 127 10:58:47 ~ $ lscpu | grep -E '^Thread|^Core|^Socket|^CPU\('
> CPU(s):                64
> Thread(s) per core:    2
> Core(s) per socket:    16
> Socket(s):             2
>
> *Description of problem:*
> During repair of the cluster, we are seeing multiple corruptions in the
> log files on a lot of instances.  There seems to be no pattern to the
> corruption.  It seems that the repair job is finding all the corrupted
> files for us.  The repair will hang on the node where the corrupted file =
is
> found.  To fix this we remove/rename the datafile and bounce the Cassandr=
a
> instance.  Our hardware/OS team have stated there is no problem on their
> side.  I do not believe it the repair causing the corruption.
>
> We have maintenance scripts that run every night running compactions and
> creating snapshots, I decided to turn these off, fix any corruptions we
> currently had and ran major compaction on all nodes, once this was done w=
e
> had a "clean" cluster and we left the cluster for a few days.  After the
> process we noticed one corruption in the cluster, this datafile was creat=
ed
> after I turned off the maintenance scripts so my theory of the scripts
> causing the issue was wrong.  We then kicked off another repair and start=
ed
> to find more corrupt files created after the maintenance script was turne=
d
> off.
>
>
> So let me give you an example of a corrupted file and maybe someone might
> be able to work through it with me?
>
> When this corrupted file was reported in the log it looks like it was the
> repair that found it.
>
> $ journalctl -u cassmeta-cass_b.service --since "2019-08-07 22:25:00"
> --until "2019-08-07 22:45:00"
>
> Aug 07 22:30:33 cassandra[34611]: INFO  21:30:33 Writing
> Memtable-compactions_in_progress@830377457(0.008KiB serialized bytes, 1
> ops, 0%/0% of on/off-heap limit)
> Aug 07 22:30:33 cassandra[34611]: ERROR 21:30:33 Failed creating a merkle
> tree for [repair #9587a200-b95a-11e9-8920-9f72868b8375 on
> KeyspaceMetadata/x, (-1476350953672479093,-1474461
> Aug 07 22:30:33 cassandra[34611]: ERROR 21:30:33 Exception in thread
> Thread[ValidationExecutor:825,1,main]
> Aug 07 22:30:33 cassandra[34611]: org.apache.cassandra.io.FSReadError:
> org.apache.cassandra.io.sstable.CorruptSSTableException: Corrupted:
> /x/ssd2/data/KeyspaceMetadata/x-1e453cb0
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.io.util.RandomAccessReader.readBytes(RandomAccessRea=
der.java:365)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.utils.ByteBufferUtil.read(ByteBufferUtil.java:361)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.utils.ByteBufferUtil.readWithShortLength(ByteBufferU=
til.java:340)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.db.composites.AbstractCType$Serializer.deserialize(A=
bstractCType.java:382)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.db.composites.AbstractCType$Serializer.deserialize(A=
bstractCType.java:366)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.db.OnDiskAtom$Serializer.deserializeFromSSTable(OnDi=
skAtom.java:81)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.db.AbstractCell$1.computeNext(AbstractCell.java:52)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.db.AbstractCell$1.computeNext(AbstractCell.java:46)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> com.google.common.collect.AbstractIterator.tryToComputeNext(AbstractItera=
tor.java:143)
> ~[guava-16.0.jar:na]
> Aug 07 22:30:33 cassandra[34611]: at
> com.google.common.collect.AbstractIterator.hasNext(AbstractIterator.java:=
138)
> ~[guava-16.0.jar:na]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.io.sstable.SSTableIdentityIterator.hasNext(SSTableId=
entityIterator.java:169)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.utils.MergeIterator$OneToOne.computeNext(MergeIterat=
or.java:202)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> com.google.common.collect.AbstractIterator.tryToComputeNext(AbstractItera=
tor.java:143)
> ~[guava-16.0.jar:na]
> Aug 07 22:30:33 cassandra[34611]: at
> com.google.common.collect.AbstractIterator.hasNext(AbstractIterator.java:=
138)
> ~[guava-16.0.jar:na]
> Aug 07 22:30:33 cassandra[34611]: at
> com.google.common.collect.Iterators$7.computeNext(Iterators.java:645)
> ~[guava-16.0.jar:na]
> Aug 07 22:30:33 cassandra[34611]: at
> com.google.common.collect.AbstractIterator.tryToComputeNext(AbstractItera=
tor.java:143)
> ~[guava-16.0.jar:na]
> Aug 07 22:30:33 cassandra[34611]: at
> com.google.common.collect.AbstractIterator.hasNext(AbstractIterator.java:=
138)
> ~[guava-16.0.jar:na]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.db.ColumnIndex$Builder.buildForCompaction(ColumnInde=
x.java:174)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.db.compaction.LazilyCompactedRow.update(LazilyCompac=
tedRow.java:187)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.repair.Validator.rowHash(Validator.java:201)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.repair.Validator.add(Validator.java:150)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.db.compaction.CompactionManager.doValidationCompacti=
on(CompactionManager.java:1166)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.db.compaction.CompactionManager.access$600(Compactio=
nManager.java:76)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.db.compaction.CompactionManager$10.call(CompactionMa=
nager.java:736)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> java.util.concurrent.FutureTask.run(FutureTask.java:266) ~[na:1.8.0_172]
> Aug 07 22:30:33 cassandra[34611]: at
> java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java=
:1149)
> ~[na:1.8.0_172]
> Aug 07 22:30:33 cassandra[34611]: at
> java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.jav=
a:624)
> [na:1.8.0_172]
> Aug 07 22:30:33 cassandra[34611]: at java.lang.Thread.run(Thread.java:748=
)
> [na:1.8.0_172]
> Aug 07 22:30:33 cassandra[34611]: Caused by:
> org.apache.cassandra.io.sstable.CorruptSSTableException: Corrupted:
> /data/ssd2/data/KeyspaceMetadata/x-x/l
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.io.compress.CompressedRandomAccessReader.reBufferMma=
p(CompressedRandomAccessReader.java:216)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.io.compress.CompressedRandomAccessReader.reBuffer(Co=
mpressedRandomAccessReader.java:226)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.io.compress.CompressedThrottledReader.reBuffer(Compr=
essedThrottledReader.java:42)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.io.util.RandomAccessReader.readBytes(RandomAccessRea=
der.java:352)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: ... 27 common frames omitted
> Aug 07 22:30:33 cassandra[34611]: Caused by:
> org.apache.cassandra.io.compress.CorruptBlockException:
> (/data/ssd2/data/KeyspaceMetadata/x-x/lb-26203-big
> Aug 07 22:30:33 cassandra[34611]: at
> org.apache.cassandra.io.compress.CompressedRandomAccessReader.reBufferMma=
p(CompressedRandomAccessReader.java:185)
> ~[apache-cassandra-2.2.13.jar:2.2.13]
> Aug 07 22:30:33 cassandra[34611]: ... 30 common frames omitted
> Aug 07 22:30:33 cassandra[34611]: INFO  21:30:33 Not a global repair, wil=
l
> not do anticompaction
> Aug 07 22:30:33 cassandra[34611]: ERROR 21:30:33 Stopping gossiper
> Aug 07 22:30:33 cassandra[34611]: WARN  21:30:33 Stopping gossip by
> operator request
> Aug 07 22:30:33 cassandra[34611]: INFO  21:30:33 Announcing shutdown
> Aug 07 22:30:33 cassandra[34611]: INFO  21:30:33 Node /10.2.57.37
> <https://urldefense.proofpoint.com/v2/url?u=3Dhttp-3A__10.2.57.37&d=3DDwM=
FaQ&c=3DLFYZ-o9_HUMeMTSQicvjIg&r=3DFsmDztdsVuIKml8IDhdHdg&m=3D4S7F10IxFntsi=
wIo-XT-YrkZE8312_yG8jMeOqOBjpE&s=3D20PLv0KNcUpBbyY1byoboimsLRjbPCLV76xL37jp=
ttQ&e=3D>
> state jump to shutdown
>
>
> So I went to the file system to see when this corrupt file was created an=
d
> it was created on July 30th at 15.55
>
> root@x 0 01:14:03 ~ # ls -l
> /data/ssd2/data/KeyspaceMetadata/x-x/lb-26203-big-Data.db
> -rw-r--r-- 1 cass_b cass_b 3182243670 Jul 30 15:55
> /data/ssd2/data/KeyspaceMetadata/x-x/lb-26203-big-Data.db
>
>
>
> So I checked /var/log/messages for errors around that time
> The only thing that stands out to me is the message "Cannot perform a ful=
l
> major compaction as repaired and unrepaired sstables cannot be compacted
> together", I'm not sure if this would be an issue though and cause
> corruption.
>
> Jul 30 15:55:06 x systemd: Created slice User Slice of root.
> Jul 30 15:55:06 x systemd: Started Session c165280 of user root.
> Jul 30 15:55:06 x audispd: node=3Dx. type=3DUSER_START
> msg=3Daudit(1564498506.021:457933): pid=3D17533 uid=3D0 auid=3D4294967295
> ses=3D4294967295 msg=3D'op=3DPAM:session_open
> grantors=3Dpam_keyinit,pam_limits,pam_keyinit,pam_limits,pam_tty_audit,pa=
m_systemd,pam_unix
> acct=3D"root" exe=3D"/usr/bin/sudo" hostname=3D? addr=3D? terminal=3D? re=
s=3Dsuccess'
> Jul 30 15:55:06 x systemd: Removed slice User Slice of root.
> Jul 30 15:55:14 x tag_audit_log: type=3DUSER_CMD
> msg=3Daudit(1564498506.013:457932): pid=3D17533 uid=3D509 auid=3D42949672=
95
> ses=3D4294967295 msg=3D'cwd=3D"/"
> cmd=3D2F7573722F7362696E2F69706D692D73656E736F7273202D2D71756965742D63616=
36865202D2D7364722D63616368652D7265637265617465202D2D696E746572707265742D6F=
656D2D64617461202D2D6F75747075742D73656E736F722D7374617465202D2D69676E6F726=
52D6E6F742D617661696C61626C652D73656E736F7273202D2D6F75747075742D73656E736F=
722D7468726573686F6C6473
> terminal=3D? res=3Dsuccess'
> Jul 30 15:55:14 x tag_audit_log: type=3DUSER_START
> msg=3Daudit(1564498506.021:457933): pid=3D17533 uid=3D0 auid=3D4294967295
> ses=3D4294967295 msg=3D'op=3DPAM:session_open
> grantors=3Dpam_keyinit,pam_limits,pam_keyinit,pam_limits,pam_tty_audit,pa=
m_systemd,pam_unix
> acct=3D"root" exe=3D"/usr/bin/sudo" hostname=3D? addr=3D? terminal=3D? re=
s=3Dsuccess'
> Jul 30 15:55:19 x cassandra: INFO  14:55:19 Writing
> Memtable-compactions_in_progress@1462227999(0.008KiB serialized bytes, 1
> ops, 0%/0% of on/off-heap limit)
> Jul 30 15:55:19 x cassandra: INFO  14:55:19 Cannot perform a full major
> compaction as repaired and unrepaired sstables cannot be compacted
> together. These two set of sstables will be compacted separately.
> Jul 30 15:55:19 x cassandra: INFO  14:55:19 Writing
> Memtable-compactions_in_progress@1198535528(1.002KiB serialized bytes, 57
> ops, 0%/0% of on/off-heap limit)
> Jul 30 15:55:20 x cassandra: INFO  14:55:20 Writing
> Memtable-compactions_in_progress@2039409834(0.008KiB serialized bytes, 1
> ops, 0%/0% of on/off-heap limit)
> Jul 30 15:55:24 x audispd: node=3Dx. type=3DUSER_LOGOUT
> msg=3Daudit(1564498524.409:457934): pid=3D46620 uid=3D0 auid=3D464400029 =
ses=3D2747
> msg=3D'op=3Dlogin id=3D464400029 exe=3D"/usr/sbin/sshd" hostname=3D? addr=
=3D?
> terminal=3D/dev/pts/0 res=3Dsuccess'
> Jul 30 15:55:24 x audispd: node=3Dx. type=3DUSER_LOGOUT
> msg=3Daudit(1564498524.409:457935): pid=3D4878 uid=3D0 auid=3D464400029 s=
es=3D2749
> msg=3D'op=3Dlogin id=3D464400029 exe=3D"/usr/sbin/sshd" hostname=3D? addr=
=3D?
> terminal=3D/dev/pts/1 res=3Dsuccess'
>
> Jul 30 15:55:57 x systemd: Created slice User Slice of root.
> Jul 30 15:55:57 x systemd: Started Session c165288 of user root.
> Jul 30 15:55:57 x audispd: node=3Dx. type=3DUSER_START
> msg=3Daudit(1564498557.294:457958): pid=3D19687 uid=3D0 auid=3D4294967295
> ses=3D4294967295 msg=3D'op=3DPAM:session_open
> grantors=3Dpam_keyinit,pam_limits,pam_keyinit,pam_limits,pam_tty_audit,pa=
m_systemd,pam_unix
> acct=3D"root" exe=3D"/usr/bin/sudo" hostname=3D? addr=3D? terminal=3D? re=
s=3Dsuccess'
> Jul 30 15:55:57 x audispd: node=3Dx. type=3DUSER_START
> msg=3Daudit(1564498557.298:457959): pid=3D19690 uid=3D0 auid=3D4294967295
> ses=3D4294967295 msg=3D'op=3DPAM:session_open
> grantors=3Dpam_keyinit,pam_systemd,pam_keyinit,pam_limits,pam_unix
> acct=3D"cass_b" exe=3D"/usr/sbin/runuser" hostname=3D? addr=3D? terminal=
=3D?
> res=3Dsuccess'
> Jul 30 15:55:58 x systemd: Removed slice User Slice of root.
> Jul 30 15:56:02 x cassandra: INFO  14:56:02 Writing
> Memtable-compactions_in_progress@1532791194(0.008KiB serialized bytes, 1
> ops, 0%/0% of on/off-heap limit)
> Jul 30 15:56:02 x cassandra: INFO  14:56:02 Cannot perform a full major
> compaction as repaired and unrepaired sstables cannot be compacted
> together. These two set of sstables will be compacted separately.
> Jul 30 15:56:02 x cassandra: INFO  14:56:02 Writing
> Memtable-compactions_in_progress@1455399453(0.281KiB serialized bytes, 16
> ops, 0%/0% of on/off-heap limit)
> Jul 30 15:56:04 x tag_audit_log: type=3DUSER_CMD
> msg=3Daudit(1564498555.190:457951): pid=3D19294 uid=3D509 auid=3D42949672=
95
> ses=3D4294967295 msg=3D'cwd=3D"/"
> cmd=3D72756E75736572202D73202F62696E2F62617368202D6C20636173735F62202D632=
063617373616E6472612D6D6574612F63617373616E6472612F62696E2F6E6F6465746F6F6C=
2074707374617473
> terminal=3D? res=3Dsuccess'
>
>
>
> We have checked a number of other things like NTP setting etc but nothing
> is telling us what could cause so many corruptions across the entire
> cluster.
> Things were healthy with this cluster for months, the only thing I can
> think is that we started loading data from a load of 20GB per instance up
> to 200GB where it sits now, maybe this just highlighted the issue.
>
>
>
> Compaction and Compression on Keyspace CL's [mixture]
> All CF's are using compression.
>
> AND compaction =3D {'min_threshold': '4', 'class':
> 'org.apache.cassandra.db.compaction.*SizeTieredCompactionStrategy*',
> 'max_threshold': '32'}
> AND compression =3D {'sstable_compression':
> 'org.apache.cassandra.io.compress.*SnappyCompressor*'}
>
> AND compaction =3D {'min_threshold': '4', 'class':
> 'org.apache.cassandra.db.compaction.*SizeTieredCompactionStrategy*',
> 'max_threshold': '32'}
> AND compression =3D {'sstable_compression':
> 'org.apache.cassandra.io.compress.*LZ4Compressor*'}
>
> AND compaction =3D {'class': 'org.apache.cassandra.db.compaction.
> *LeveledCompactionStrategy*'}
> AND compression =3D {'sstable_compression':
> 'org.apache.cassandra.io.compress.*SnappyCompressor*'}
>
> --We are also using internode network compression:
> internode_compression: all
>
>
>
> Does anyone have any idea what I should check next?
> Our next theory is that there may be an issue with Checksum, but I'm not
> sure where to go with this.
>
>
>
> Any help would be very much appreciated before I lose the last bit of hai=
r
> I have on my head.
>
>
>
> Kind Regards,
>
> Phil
>
>
>
> On Wed, 7 Aug 2019 at 20:51, Nitan Kainth <nitankainth@gmail.com> wrote:
>
> Repair during upgrade have caused corruption too.
>
>
>
> Also, dropping and adding columns with same name but different type
>
>
>
> Regards,
>
> Nitan
>
> Cell: 510 449 9629
>
>
> On Aug 7, 2019, at 2:42 PM, Jeff Jirsa <jjirsa@gmail.com> wrote:
>
> Is compression enabled?
>
>
>
> If not, bit flips on disk can corrupt data files and reads + repair may
> send that corruption to other hosts in the cluster
>
>
> On Aug 7, 2019, at 3:46 AM, Philip =C3=93 Cond=C3=BAin <philipoconduin@gm=
ail.com>
> wrote:
>
> Hi All,
>
>
>
> I am currently experiencing multiple datafile corruptions across most
> nodes in my cluster, there seems to be no pattern to the corruption.  I'm
> starting to think it might be a bug, we're using Cassandra 2.2.13.
>
>
>
> Without going into detail about the issue I just want to confirm somethin=
g.
>
>
>
> Can someone share with me a list of scenarios that would cause corruption=
?
>
>
>
> 1. OS failure
>
> 2. Cassandra disturbed during the writing
>
>
>
> etc etc.
>
>
>
> I need to investigate each scenario and don't want to leave any out.
>
>
>
> --
>
> Regards,
>
> Phil
>
>
>
>
> --
>
> Regards,
>
> Phil
>


--=20
Regards,
Phil

--000000000000892f66058f9d962c
Content-Type: text/html; charset="UTF-8"
Content-Transfer-Encoding: quoted-printable

<div dir=3D"ltr"><div class=3D"gmail_default" style=3D"font-family:tahoma,s=
ans-serif"><b>@Jeff </b>- If it was hardware that would explain it all, but=
 do you think it&#39;s possible to have every server in the cluster with a =
hardware issue?<br></div><div class=3D"gmail_default" style=3D"font-family:=
tahoma,sans-serif">The data is sensitive and the customer would lose their =
mind if I sent it off-site which is a pity cause I could really do with the=
 help.</div><div class=3D"gmail_default" style=3D"font-family:tahoma,sans-s=
erif">The corruption is occurring irregularly on every server and instance =
and column family in the cluster.=C2=A0 Out of 72 instances, we are getting=
 maybe 10 corrupt files per day.</div><div class=3D"gmail_default" style=3D=
"font-family:tahoma,sans-serif">We are using vnodes (256) and it is happeni=
ng in both DC&#39;s</div><div class=3D"gmail_default" style=3D"font-family:=
tahoma,sans-serif"><br></div><div class=3D"gmail_default" style=3D"font-fam=
ily:tahoma,sans-serif"><b>@Asad </b>- internode compression is set to ALL o=
n every server.=C2=A0 I have checked the packets for the private interconne=
ct and I can&#39;t see any dropped packets, there are dropped packets for o=
ther interfaces, but not for the private ones, I will get the network team =
to double-check this.=C2=A0<br></div><div class=3D"gmail_default" style=3D"=
font-family:tahoma,sans-serif">The corruption is only on the application sc=
hema, we are not getting corruption on any system or cass keyspaces.=C2=A0 =
Corruption is happening in both DC&#39;s.=C2=A0 We are getting corruption f=
or the 1 application schema we have across all tables in the keyspace, it&#=
39;s not limited to one table.</div><div class=3D"gmail_default" style=3D"f=
ont-family:tahoma,sans-serif">Im not sure why the app team decided to not u=
se default compression, I must ask them.</div><div class=3D"gmail_default" =
style=3D"font-family:tahoma,sans-serif"><br></div><div class=3D"gmail_defau=
lt" style=3D"font-family:tahoma,sans-serif"><br></div><div class=3D"gmail_d=
efault" style=3D"font-family:tahoma,sans-serif"><br></div><div class=3D"gma=
il_default" style=3D"font-family:tahoma,sans-serif">I have been checking th=
e /var/log/messages today going back a few weeks and can see a serious amou=
nt of broken pipe errors across all servers and instances.</div><div class=
=3D"gmail_default" style=3D"font-family:tahoma,sans-serif">Here is a snippe=
t from one server but most pipe errors are similar:</div><div class=3D"gmai=
l_default" style=3D"font-family:tahoma,sans-serif"><br></div><div class=3D"=
gmail_default" style=3D""><font face=3D"courier new, monospace">Jul =C2=A09=
 03:00:08 =C2=A0cassandra: INFO =C2=A002:00:08 Writing Memtable-sstable_act=
ivity@1126262628(43.631KiB serialized bytes, 18072 ops, 0%/0% of on/off-hea=
p limit)<br>Jul =C2=A09 03:00:13 =C2=A0kernel: fnic_handle_fip_timer: 8 cal=
lbacks suppressed<br>Jul =C2=A09 03:00:19 =C2=A0kernel: fnic_handle_fip_tim=
er: 8 callbacks suppressed<br>Jul =C2=A09 03:00:22 =C2=A0cassandra: ERROR 0=
2:00:22 Got an IOException during write!<br>Jul =C2=A09 03:00:22 =C2=A0cass=
andra: java.io.IOException: Broken pipe<br>Jul =C2=A09 03:00:22 =C2=A0cassa=
ndra: at sun.nio.ch.FileDispatcherImpl.write0(Native Method) ~[na:1.8.0_172=
]<br>Jul =C2=A09 03:00:22 =C2=A0cassandra: at sun.nio.ch.SocketDispatcher.w=
rite(SocketDispatcher.java:47) ~[na:1.8.0_172]<br>Jul =C2=A09 03:00:22 =C2=
=A0cassandra: at sun.nio.ch.IOUtil.writeFromNativeBuffer(IOUtil.java:93) ~[=
na:1.8.0_172]<br>Jul =C2=A09 03:00:22 =C2=A0cassandra: at sun.nio.ch.IOUtil=
.write(IOUtil.java:65) ~[na:1.8.0_172]<br>Jul =C2=A09 03:00:22 =C2=A0cassan=
dra: at sun.nio.ch.SocketChannelImpl.write(SocketChannelImpl.java:471) ~[na=
:1.8.0_172]<br>Jul =C2=A09 03:00:22 =C2=A0cassandra: at org.apache.thrift.t=
ransport.TNonblockingSocket.write(TNonblockingSocket.java:165) ~[libthrift-=
0.9.2.jar:0.9.2]<br>Jul =C2=A09 03:00:22 =C2=A0cassandra: at com.thinkaurel=
ius.thrift.util.mem.Buffer.writeTo(Buffer.java:104) ~[thrift-server-0.3.7.j=
ar:na]<br>Jul =C2=A09 03:00:22 =C2=A0cassandra: at com.thinkaurelius.thrift=
.util.mem.FastMemoryOutputTransport.streamTo(FastMemoryOutputTransport.java=
:112) ~[thrift-server-0.3.7.jar:na]<br>Jul =C2=A09 03:00:22 =C2=A0cassandra=
: at com.thinkaurelius.thrift.Message.write(Message.java:222) ~[thrift-serv=
er-0.3.7.jar:na]<br>Jul =C2=A09 03:00:22 =C2=A0cassandra: at com.thinkaurel=
ius.thrift.TDisruptorServer$SelectorThread.handleWrite(TDisruptorServer.jav=
a:598) [thrift-server-0.3.7.jar:na]<br>Jul =C2=A09 03:00:22 =C2=A0cassandra=
: at com.thinkaurelius.thrift.TDisruptorServer$SelectorThread.processKey(TD=
isruptorServer.java:569) [thrift-server-0.3.7.jar:na]<br>Jul =C2=A09 03:00:=
22 =C2=A0cassandra: at com.thinkaurelius.thrift.TDisruptorServer$AbstractSe=
lectorThread.select(TDisruptorServer.java:423) [thrift-server-0.3.7.jar:na]=
<br>Jul =C2=A09 03:00:22 =C2=A0cassandra: at com.thinkaurelius.thrift.TDisr=
uptorServer$AbstractSelectorThread.run(TDisruptorServer.java:383) [thrift-s=
erver-0.3.7.jar:na]<br>Jul =C2=A09 03:00:25 =C2=A0kernel: fnic_handle_fip_t=
imer: 8 callbacks suppressed<br>Jul =C2=A09 03:00:30 =C2=A0cassandra: ERROR=
 02:00:30 Got an IOException during write!<br>Jul =C2=A09 03:00:30 =C2=A0ca=
ssandra: java.io.IOException: Broken pipe<br>Jul =C2=A09 03:00:30 =C2=A0cas=
sandra: at sun.nio.ch.FileDispatcherImpl.write0(Native Method) ~[na:1.8.0_1=
72]<br>Jul =C2=A09 03:00:30 =C2=A0cassandra: at sun.nio.ch.SocketDispatcher=
.write(SocketDispatcher.java:47) ~[na:1.8.0_172]<br>Jul =C2=A09 03:00:30 =
=C2=A0cassandra: at sun.nio.ch.IOUtil.writeFromNativeBuffer(IOUtil.java:93)=
 ~[na:1.8.0_172]<br>Jul =C2=A09 03:00:30 =C2=A0cassandra: at sun.nio.ch.IOU=
til.write(IOUtil.java:65) ~[na:1.8.0_172]<br>Jul =C2=A09 03:00:30 =C2=A0cas=
sandra: at sun.nio.ch.SocketChannelImpl.write(SocketChannelImpl.java:471) ~=
[na:1.8.0_172]<br>Jul =C2=A09 03:00:30 =C2=A0cassandra: at org.apache.thrif=
t.transport.TNonblockingSocket.write(TNonblockingSocket.java:165) ~[libthri=
ft-0.9.2.jar:0.9.2]<br>Jul =C2=A09 03:00:30 =C2=A0cassandra: at com.thinkau=
relius.thrift.util.mem.Buffer.writeTo(Buffer.java:104) ~[thrift-server-0.3.=
7.jar:na]<br>Jul =C2=A09 03:00:30 =C2=A0cassandra: at com.thinkaurelius.thr=
ift.util.mem.FastMemoryOutputTransport.streamTo(FastMemoryOutputTransport.j=
ava:112) ~[thrift-server-0.3.7.jar:na]<br>Jul =C2=A09 03:00:30 =C2=A0cassan=
dra: at com.thinkaurelius.thrift.Message.write(Message.java:222) ~[thrift-s=
erver-0.3.7.jar:na]<br>Jul =C2=A09 03:00:30 =C2=A0cassandra: at com.thinkau=
relius.thrift.TDisruptorServer$SelectorThread.handleWrite(TDisruptorServer.=
java:598) [thrift-server-0.3.7.jar:na]<br>Jul =C2=A09 03:00:30 =C2=A0cassan=
dra: at com.thinkaurelius.thrift.TDisruptorServer$SelectorThread.processKey=
(TDisruptorServer.java:569) [thrift-server-0.3.7.jar:na]<br>Jul =C2=A09 03:=
00:30 =C2=A0cassandra: at com.thinkaurelius.thrift.TDisruptorServer$Abstrac=
tSelectorThread.select(TDisruptorServer.java:423) [thrift-server-0.3.7.jar:=
na]<br>Jul =C2=A09 03:00:30 =C2=A0cassandra: at com.thinkaurelius.thrift.TD=
isruptorServer$AbstractSelectorThread.run(TDisruptorServer.java:383) [thrif=
t-server-0.3.7.jar:na]<br>Jul =C2=A09 03:00:31 =C2=A0kernel: fnic_handle_fi=
p_timer: 8 callbacks suppressed<br>Jul =C2=A09 03:00:37 =C2=A0kernel: fnic_=
handle_fip_timer: 8 callbacks suppressed<br>Jul =C2=A09 03:00:43 =C2=A0kern=
el: fnic_handle_fip_timer: 8 callbacks suppressed</font><br><br></div><div =
class=3D"gmail_default" style=3D"font-family:tahoma,sans-serif"><br></div><=
/div><br><div class=3D"gmail_quote"><div dir=3D"ltr" class=3D"gmail_attr">O=
n Thu, 8 Aug 2019 at 15:42, ZAIDI, ASAD A &lt;<a href=3D"mailto:az192g@att.=
com">az192g@att.com</a>&gt; wrote:<br></div><blockquote class=3D"gmail_quot=
e" style=3D"margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204)=
;padding-left:1ex">





<div lang=3D"EN-US">
<div class=3D"gmail-m_2638314099204245784WordSection1">
<p class=3D"MsoNormal"><span style=3D"font-size:11pt;font-family:Calibri,sa=
ns-serif;color:rgb(31,73,125)">Did you check if packets are NOT being dropp=
ed for network interfaces Cassandra instances are consuming (ifconfig =E2=
=80=93a) internode compression is set for all endpoint
 =E2=80=93 may be network is playing any role here?<u></u><u></u></span></p=
>
<p class=3D"MsoNormal"><span style=3D"font-size:11pt;font-family:Calibri,sa=
ns-serif;color:rgb(31,73,125)">is this corruption limited so certain keyspa=
ce/table | DCs or is that wide spread =E2=80=93 the log snippet you shared =
it looked like only specific keyspace/table is
 affected =E2=80=93 is that correct?<u></u><u></u></span></p>
<p class=3D"MsoNormal"><span style=3D"font-size:11pt;font-family:Calibri,sa=
ns-serif;color:rgb(31,73,125)">When you remove corrupted sstable of a certa=
in table, I guess you verifies all nodes for corrupted sstables for same ta=
ble (may be with with nodetool scrub tool)
 so to limit spread of corruptions =E2=80=93 right?<u></u><u></u></span></p=
>
<p class=3D"MsoNormal"><span style=3D"font-size:11pt;font-family:Calibri,sa=
ns-serif;color:rgb(31,73,125)">Just curious to know =E2=80=93 you=E2=80=99r=
e not using lz4/default compressor for all tables there must be some reason=
 for it.<u></u><u></u></span></p>
<p class=3D"MsoNormal"><span style=3D"font-size:11pt;font-family:Calibri,sa=
ns-serif;color:rgb(31,73,125)"><u></u>=C2=A0<u></u></span></p>
<p class=3D"MsoNormal"><span style=3D"font-size:11pt;font-family:Calibri,sa=
ns-serif;color:rgb(31,73,125)"><u></u>=C2=A0<u></u></span></p>
<p class=3D"MsoNormal"><span style=3D"font-size:11pt;font-family:Calibri,sa=
ns-serif;color:rgb(31,73,125)"><u></u>=C2=A0<u></u></span></p>
<p class=3D"MsoNormal"><b><span style=3D"font-size:11pt;font-family:Calibri=
,sans-serif">From:</span></b><span style=3D"font-size:11pt;font-family:Cali=
bri,sans-serif"> Philip =C3=93 Cond=C3=BAin [mailto:<a href=3D"mailto:phili=
poconduin@gmail.com" target=3D"_blank">philipoconduin@gmail.com</a>]
<br>
<b>Sent:</b> Thursday, August 08, 2019 6:20 AM<br>
<b>To:</b> <a href=3D"mailto:user@cassandra.apache.org" target=3D"_blank">u=
ser@cassandra.apache.org</a><br>
<b>Subject:</b> Re: Datafile Corruption<u></u><u></u></span></p>
<p class=3D"MsoNormal"><u></u>=C2=A0<u></u></p>
<div>
<div>
<p class=3D"MsoNormal" style=3D"margin-bottom:12pt"><span style=3D"font-fam=
ily:Tahoma,sans-serif">Hi All,</span><br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">Thank you so much for the rep=
lies. =C2=A0</span><br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">Currently, I have the followi=
ng list that can potentially cause some sort of corruption in a Cassandra c=
luster.
</span><u></u><u></u></p>
<ul type=3D"disc">
<li class=3D"MsoNormal">
<span style=3D"font-family:Tahoma,sans-serif">Sudden Power cut =C2=A0- =C2=
=A0<i>We have had no power cuts in the datacenters</i><u></u><u></u></span>=
</li><li class=3D"MsoNormal">
<span style=3D"font-family:Tahoma,sans-serif">Network Issues - <i>no networ=
k issues from what I can tell</i><u></u><u></u></span></li><li class=3D"Mso=
Normal">
<span style=3D"font-family:Tahoma,sans-serif">Disk full - <i>I don&#39;t th=
ink this is an issue for us, see disks below.</i><u></u><u></u></span></li>=
<li class=3D"MsoNormal">
<span style=3D"font-family:Tahoma,sans-serif">An issue in Casandra version =
like Cassandra-13752 -<i> couldn&#39;t find any Jira issues similar to ours=
.</i><u></u><u></u></span></li><li class=3D"MsoNormal">
<span style=3D"font-family:Tahoma,sans-serif">Bit Flips -<i> we have compre=
ssion enabled so I don&#39;t think this should be an issue.</i><u></u><u></=
u></span></li><li class=3D"MsoNormal">
<span style=3D"font-family:Tahoma,sans-serif">Repair during upgrade has cau=
sed corruption too -<i> we have not upgraded</i><u></u><u></u></span></li><=
li class=3D"MsoNormal">
<span style=3D"font-family:Tahoma,sans-serif">Dropping and adding columns w=
ith the same name but a different type -
<i>I will need to ask the apps team how they are using the database.</i><u>=
</u><u></u></span></li></ul>
<p class=3D"MsoNormal"><br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">Ok, let me try and explain th=
e issue we are having, I am under a lot of pressure from above to get this =
fixed and I can&#39;t figure it out.</span><br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">This is a PRE-PROD environmen=
t.</span><u></u><u></u></p>
<ul type=3D"disc">
<li class=3D"MsoNormal">
<span style=3D"font-family:Tahoma,sans-serif">2 datacenters.<u></u><u></u><=
/span></li><li class=3D"MsoNormal">
<span style=3D"font-family:Tahoma,sans-serif">9 physical servers in each da=
tacenter<u></u><u></u></span></li><li class=3D"MsoNormal">
<span style=3D"font-family:Tahoma,sans-serif">4 Cassandra instances on each=
 server<u></u><u></u></span></li><li class=3D"MsoNormal">
<span style=3D"font-family:Tahoma,sans-serif">72 Cassandra instances across=
 the 2 data centres, 36 in site A, 36 in site B.<u></u><u></u></span></li><=
/ul>
<p class=3D"MsoNormal"><br>
<span style=3D"font-family:Tahoma,sans-serif">We also have 2 Reaper Nodes w=
e use for repair.=C2=A0 One reaper node in each datacenter each running wit=
h its own Cassandra back end in a cluster together.</span><br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">OS Details [Red Hat Linux]</s=
pan><br>
<span style=3D"font-family:&quot;Courier New&quot;">cass_a@x 0 10:53:01 ~ $=
 uname -a<br>
Linux x 3.10.0-957.5.1.el7.x86_64 #1 SMP Wed Dec 19 10:46:58 EST 2018 x86_6=
4 x86_64 x86_64 GNU/Linux<br>
</span><br>
<span style=3D"font-family:&quot;Courier New&quot;">cass_a@x 0 10:57:31 ~ $=
 cat /etc/*release<br>
NAME=3D&quot;Red Hat Enterprise Linux Server&quot;<br>
VERSION=3D&quot;7.6 (Maipo)&quot;<br>
ID=3D&quot;rhel&quot;</span><br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">Storage Layout </span><br>
<span style=3D"font-family:&quot;Courier New&quot;">cass_a@xx 0 10:46:28 ~ =
$ df -h<br>
Filesystem =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =
=C2=A0 =C2=A0 =C2=A0 Size =C2=A0Used Avail Use% Mounted on<br>
/dev/mapper/vg01-lv_root =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A020G =C2=
=A02.2G =C2=A0 18G =C2=A011% /<br>
devtmpfs =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=
=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A063G =C2=A0 =C2=A0 0 =C2=A0 63G =C2=A0 0% /de=
v<br>
tmpfs =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0=
 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 63G =C2=A0 =C2=A0 0 =C2=A0 63G =C2=A0 0=
% /dev/shm<br>
tmpfs =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0=
 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 63G =C2=A04.1G =C2=A0 59G =C2=A0 7% /ru=
n<br>
tmpfs =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0=
 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 63G =C2=A0 =C2=A0 0 =C2=A0 63G =C2=A0 0=
% /sys/fs/cgroup<br>
&gt;&gt; 4 cassandra instances<br>
/dev/sdd =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=
=A0 =C2=A0 =C2=A0 =C2=A0 1.5T =C2=A0802G =C2=A0688G =C2=A054% /data/ssd4<br=
>
/dev/sda =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=
=A0 =C2=A0 =C2=A0 =C2=A0 1.5T =C2=A0798G =C2=A0692G =C2=A054% /data/ssd1<br=
>
/dev/sdb =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=
=A0 =C2=A0 =C2=A0 =C2=A0 1.5T =C2=A0681G =C2=A0810G =C2=A046% /data/ssd2<br=
>
/dev/sdc =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=
=A0 =C2=A0 =C2=A0 =C2=A0 1.5T =C2=A0558G =C2=A0932G =C2=A038% /data/ssd3</s=
pan><br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">Cassandra load is about 200GB=
 and the rest of the space is snapshots</span><br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">CPU</span><br>
<span style=3D"font-family:&quot;Courier New&quot;">cass_a@x 127 10:58:47 ~=
 $ lscpu | grep -E &#39;^Thread|^Core|^Socket|^CPU\(&#39;<br>
CPU(s): =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A064<br>
Thread(s) per core: =C2=A0 =C2=A02<br>
Core(s) per socket: =C2=A0 =C2=A016<br>
Socket(s): =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 2<br>
</span><br>
<b><span style=3D"font-family:Tahoma,sans-serif">Description of problem:</s=
pan></b><br>
<span style=3D"font-family:Tahoma,sans-serif">During repair of the cluster,=
 we are seeing multiple corruptions in the log files on a lot of instances.=
=C2=A0 There seems to be no pattern to the corruption.=C2=A0 It seems that =
the repair job is finding all the corrupted
 files for us.=C2=A0 The repair will hang on the node where the corrupted f=
ile is found.=C2=A0 To fix this we remove/rename the datafile and bounce th=
e Cassandra instance.=C2=A0 Our hardware/OS team have stated there is no pr=
oblem on their side.=C2=A0 I do not believe it the repair
 causing the corruption. </span><br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">We have maintenance scripts t=
hat run every night running compactions and creating snapshots, I decided t=
o turn these off, fix any corruptions we currently had and ran major compac=
tion on all nodes, once this was
 done we had a &quot;clean&quot; cluster and we left the cluster for a few =
days.=C2=A0 After the process we noticed one corruption in the cluster, thi=
s datafile was created after I turned off the maintenance scripts so my the=
ory of the scripts causing the issue was wrong.=C2=A0
 We then kicked off another repair and started to find more corrupt files c=
reated after the maintenance script was turned off.</span><br>
<br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">So let me give you an example=
 of a corrupted file and maybe someone might be able to work through it wit=
h me?</span><br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">When this corrupted file was =
reported in the log it looks like it was the repair that found it.</span><b=
r>
<br>
<span style=3D"font-family:&quot;Courier New&quot;">$ journalctl -u cassmet=
a-cass_b.service --since &quot;2019-08-07 22:25:00&quot; --until &quot;2019=
-08-07 22:45:00&quot;<br>
<br>
Aug 07 22:30:33 cassandra[34611]: INFO =C2=A021:30:33 Writing <a href=3D"ma=
ilto:Memtable-compactions_in_progress@830377457(0.008KiB" target=3D"_blank"=
>
Memtable-compactions_in_progress@830377457(0.008KiB</a> serialized bytes, 1=
 ops, 0%/0% of on/off-heap limit)<br>
<span style=3D"background:yellow">Aug 07 22:30:33 cassandra[34611]: ERROR 2=
1:30:33 Failed creating a merkle tree for [repair #9587a200-b95a-11e9-8920-=
9f72868b8375 on KeyspaceMetadata/x, (-1476350953672479093,-1474461<br>
Aug 07 22:30:33 cassandra[34611]: ERROR 21:30:33 Exception in thread Thread=
[ValidationExecutor:825,1,main]<br>
Aug 07 22:30:33 cassandra[34611]: org.apache.cassandra.io.FSReadError: org.=
apache.cassandra.io.sstable.CorruptSSTableException: Corrupted: /x/ssd2/dat=
a/KeyspaceMetadata/x-1e453cb0</span><br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.io.util.RandomAcc=
essReader.readBytes(RandomAccessReader.java:365) ~[apache-cassandra-2.2.13.=
jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.utils.ByteBufferU=
til.read(ByteBufferUtil.java:361) ~[apache-cassandra-2.2.13.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.utils.ByteBufferU=
til.readWithShortLength(ByteBufferUtil.java:340) ~[apache-cassandra-2.2.13.=
jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.db.composites.Abs=
tractCType$Serializer.deserialize(AbstractCType.java:382) ~[apache-cassandr=
a-2.2.13.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.db.composites.Abs=
tractCType$Serializer.deserialize(AbstractCType.java:366) ~[apache-cassandr=
a-2.2.13.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.db.OnDiskAtom$Ser=
ializer.deserializeFromSSTable(OnDiskAtom.java:81) ~[apache-cassandra-2.2.1=
3.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.db.AbstractCell$1=
.computeNext(AbstractCell.java:52) ~[apache-cassandra-2.2.13.jar:2.2.13]<br=
>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.db.AbstractCell$1=
.computeNext(AbstractCell.java:46) ~[apache-cassandra-2.2.13.jar:2.2.13]<br=
>
Aug 07 22:30:33 cassandra[34611]: at com.google.common.collect.AbstractIter=
ator.tryToComputeNext(AbstractIterator.java:143) ~[guava-16.0.jar:na]<br>
Aug 07 22:30:33 cassandra[34611]: at com.google.common.collect.AbstractIter=
ator.hasNext(AbstractIterator.java:138) ~[guava-16.0.jar:na]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.io.sstable.SSTabl=
eIdentityIterator.hasNext(SSTableIdentityIterator.java:169) ~[apache-cassan=
dra-2.2.13.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.utils.MergeIterat=
or$OneToOne.computeNext(MergeIterator.java:202) ~[apache-cassandra-2.2.13.j=
ar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at com.google.common.collect.AbstractIter=
ator.tryToComputeNext(AbstractIterator.java:143) ~[guava-16.0.jar:na]<br>
Aug 07 22:30:33 cassandra[34611]: at com.google.common.collect.AbstractIter=
ator.hasNext(AbstractIterator.java:138) ~[guava-16.0.jar:na]<br>
Aug 07 22:30:33 cassandra[34611]: at com.google.common.collect.Iterators$7.=
computeNext(Iterators.java:645) ~[guava-16.0.jar:na]<br>
Aug 07 22:30:33 cassandra[34611]: at com.google.common.collect.AbstractIter=
ator.tryToComputeNext(AbstractIterator.java:143) ~[guava-16.0.jar:na]<br>
Aug 07 22:30:33 cassandra[34611]: at com.google.common.collect.AbstractIter=
ator.hasNext(AbstractIterator.java:138) ~[guava-16.0.jar:na]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.db.ColumnIndex$Bu=
ilder.buildForCompaction(ColumnIndex.java:174) ~[apache-cassandra-2.2.13.ja=
r:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.db.compaction.Laz=
ilyCompactedRow.update(LazilyCompactedRow.java:187) ~[apache-cassandra-2.2.=
13.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.repair.Validator.=
rowHash(Validator.java:201) ~[apache-cassandra-2.2.13.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.repair.Validator.=
add(Validator.java:150) ~[apache-cassandra-2.2.13.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.db.compaction.Com=
pactionManager.doValidationCompaction(CompactionManager.java:1166) ~[apache=
-cassandra-2.2.13.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.db.compaction.Com=
pactionManager.access$600(CompactionManager.java:76) ~[apache-cassandra-2.2=
.13.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.db.compaction.Com=
pactionManager$10.call(CompactionManager.java:736) ~[apache-cassandra-2.2.1=
3.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at java.util.concurrent.FutureTask.run(Fu=
tureTask.java:266) ~[na:1.8.0_172]<br>
Aug 07 22:30:33 cassandra[34611]: at java.util.concurrent.ThreadPoolExecuto=
r.runWorker(ThreadPoolExecutor.java:1149) ~[na:1.8.0_172]<br>
Aug 07 22:30:33 cassandra[34611]: at java.util.concurrent.ThreadPoolExecuto=
r$Worker.run(ThreadPoolExecutor.java:624) [na:1.8.0_172]<br>
Aug 07 22:30:33 cassandra[34611]: at java.lang.Thread.run(Thread.java:748) =
[na:1.8.0_172]<br>
Aug 07 22:30:33 cassandra[34611]: Caused by: org.apache.cassandra.io.sstabl=
e.CorruptSSTableException: Corrupted: /data/ssd2/data/KeyspaceMetadata/x-x/=
l<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.io.compress.Compr=
essedRandomAccessReader.reBufferMmap(CompressedRandomAccessReader.java:216)=
 ~[apache-cassandra-2.2.13.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.io.compress.Compr=
essedRandomAccessReader.reBuffer(CompressedRandomAccessReader.java:226) ~[a=
pache-cassandra-2.2.13.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.io.compress.Compr=
essedThrottledReader.reBuffer(CompressedThrottledReader.java:42) ~[apache-c=
assandra-2.2.13.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.io.util.RandomAcc=
essReader.readBytes(RandomAccessReader.java:352) ~[apache-cassandra-2.2.13.=
jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: ... 27 common frames omitted<br>
Aug 07 22:30:33 cassandra[34611]: Caused by: org.apache.cassandra.io.compre=
ss.CorruptBlockException: (/data/ssd2/data/KeyspaceMetadata/x-x/lb-26203-bi=
g<br>
Aug 07 22:30:33 cassandra[34611]: at org.apache.cassandra.io.compress.Compr=
essedRandomAccessReader.reBufferMmap(CompressedRandomAccessReader.java:185)=
 ~[apache-cassandra-2.2.13.jar:2.2.13]<br>
Aug 07 22:30:33 cassandra[34611]: ... 30 common frames omitted<br>
Aug 07 22:30:33 cassandra[34611]: INFO =C2=A021:30:33 Not a global repair, =
will not do anticompaction<br>
Aug 07 22:30:33 cassandra[34611]: ERROR 21:30:33 Stopping gossiper<br>
Aug 07 22:30:33 cassandra[34611]: WARN =C2=A021:30:33 Stopping gossip by op=
erator request<br>
Aug 07 22:30:33 cassandra[34611]: INFO =C2=A021:30:33 Announcing shutdown<b=
r>
Aug 07 22:30:33 cassandra[34611]: INFO =C2=A021:30:33 Node /<a href=3D"http=
s://urldefense.proofpoint.com/v2/url?u=3Dhttp-3A__10.2.57.37&amp;d=3DDwMFaQ=
&amp;c=3DLFYZ-o9_HUMeMTSQicvjIg&amp;r=3DFsmDztdsVuIKml8IDhdHdg&amp;m=3D4S7F=
10IxFntsiwIo-XT-YrkZE8312_yG8jMeOqOBjpE&amp;s=3D20PLv0KNcUpBbyY1byoboimsLRj=
bPCLV76xL37jpttQ&amp;e=3D" target=3D"_blank">10.2.57.37</a>
 state jump to shutdown</span><br>
<br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">So I went to the file system =
to see when this corrupt file was created and it was created on July 30th a=
t 15.55</span><br>
<br>
<span style=3D"font-family:&quot;Courier New&quot;">root@x 0 01:14:03 ~ # l=
s -l /data/ssd2/data/KeyspaceMetadata/x-x/lb-26203-big-Data.db<br>
-rw-r--r-- 1 cass_b cass_b 3182243670 Jul 30 15:55 /data/ssd2/data/Keyspace=
Metadata/x-x/lb-26203-big-Data.db</span><br>
<br>
<br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">So I checked /var/log/message=
s for errors around that time</span><br>
<span style=3D"font-family:Tahoma,sans-serif">The only thing that stands ou=
t to me is the message &quot;Cannot perform a full major compaction as repa=
ired and unrepaired sstables cannot be compacted together&quot;, I&#39;m no=
t sure if this would be an issue though and cause
 corruption.</span><br>
<br>
<span style=3D"font-family:&quot;Courier New&quot;">Jul 30 15:55:06 x syste=
md: Created slice User Slice of root.<br>
Jul 30 15:55:06 x systemd: Started Session c165280 of user root.<br>
Jul 30 15:55:06 x audispd: node=3Dx. type=3DUSER_START msg=3Daudit(15644985=
06.021:457933): pid=3D17533 uid=3D0 auid=3D4294967295 ses=3D4294967295 msg=
=3D&#39;op=3DPAM:session_open grantors=3Dpam_keyinit,pam_limits,pam_keyinit=
,pam_limits,pam_tty_audit,pam_systemd,pam_unix acct=3D&quot;root&quot;
 exe=3D&quot;/usr/bin/sudo&quot; hostname=3D? addr=3D? terminal=3D? res=3Ds=
uccess&#39;<br>
Jul 30 15:55:06 x systemd: Removed slice User Slice of root.<br>
Jul 30 15:55:14 x tag_audit_log: type=3DUSER_CMD msg=3Daudit(1564498506.013=
:457932): pid=3D17533 uid=3D509 auid=3D4294967295 ses=3D4294967295 msg=3D&#=
39;cwd=3D&quot;/&quot; cmd=3D2F7573722F7362696E2F69706D692D73656E736F727320=
2D2D71756965742D6361636865202D2D7364722D63616368652D7265637265617465202D2D6=
96E746572707265742D6F656D2D64617461202D2D6F75747075742D73656E736F722D737461=
7465202D2D69676E6F72652D6E6F742D617661696C61626C652D73656E736F7273202D2D6F7=
5747075742D73656E736F722D7468726573686F6C6473
 terminal=3D? res=3Dsuccess&#39;<br>
Jul 30 15:55:14 x tag_audit_log: type=3DUSER_START msg=3Daudit(1564498506.0=
21:457933): pid=3D17533 uid=3D0 auid=3D4294967295 ses=3D4294967295 msg=3D&#=
39;op=3DPAM:session_open grantors=3Dpam_keyinit,pam_limits,pam_keyinit,pam_=
limits,pam_tty_audit,pam_systemd,pam_unix acct=3D&quot;root&quot;
 exe=3D&quot;/usr/bin/sudo&quot; hostname=3D? addr=3D? terminal=3D? res=3Ds=
uccess&#39;<br>
Jul 30 15:55:19 x cassandra: INFO =C2=A014:55:19 Writing <a href=3D"mailto:=
Memtable-compactions_in_progress@1462227999(0.008KiB" target=3D"_blank">
Memtable-compactions_in_progress@1462227999(0.008KiB</a> serialized bytes, =
1 ops, 0%/0% of on/off-heap limit)<br>
<span style=3D"background:yellow">Jul 30 15:55:19 x cassandra: INFO =C2=A01=
4:55:19 Cannot perform a full major compaction as repaired and unrepaired s=
stables cannot be compacted together. These two set of sstables will be com=
pacted separately.</span><br>
Jul 30 15:55:19 x cassandra: INFO =C2=A014:55:19 Writing <a href=3D"mailto:=
Memtable-compactions_in_progress@1198535528(1.002KiB" target=3D"_blank">
Memtable-compactions_in_progress@1198535528(1.002KiB</a> serialized bytes, =
57 ops, 0%/0% of on/off-heap limit)<br>
Jul 30 15:55:20 x cassandra: INFO =C2=A014:55:20 Writing <a href=3D"mailto:=
Memtable-compactions_in_progress@2039409834(0.008KiB" target=3D"_blank">
Memtable-compactions_in_progress@2039409834(0.008KiB</a> serialized bytes, =
1 ops, 0%/0% of on/off-heap limit)<br>
Jul 30 15:55:24 x audispd: node=3Dx. type=3DUSER_LOGOUT msg=3Daudit(1564498=
524.409:457934): pid=3D46620 uid=3D0 auid=3D464400029 ses=3D2747 msg=3D&#39=
;op=3Dlogin id=3D464400029 exe=3D&quot;/usr/sbin/sshd&quot; hostname=3D? ad=
dr=3D? terminal=3D/dev/pts/0 res=3Dsuccess&#39;<br>
Jul 30 15:55:24 x audispd: node=3Dx. type=3DUSER_LOGOUT msg=3Daudit(1564498=
524.409:457935): pid=3D4878 uid=3D0 auid=3D464400029 ses=3D2749 msg=3D&#39;=
op=3Dlogin id=3D464400029 exe=3D&quot;/usr/sbin/sshd&quot; hostname=3D? add=
r=3D? terminal=3D/dev/pts/1 res=3Dsuccess&#39;<br>
<br>
Jul 30 15:55:57 x systemd: Created slice User Slice of root.<br>
Jul 30 15:55:57 x systemd: Started Session c165288 of user root.<br>
Jul 30 15:55:57 x audispd: node=3Dx. type=3DUSER_START msg=3Daudit(15644985=
57.294:457958): pid=3D19687 uid=3D0 auid=3D4294967295 ses=3D4294967295 msg=
=3D&#39;op=3DPAM:session_open grantors=3Dpam_keyinit,pam_limits,pam_keyinit=
,pam_limits,pam_tty_audit,pam_systemd,pam_unix acct=3D&quot;root&quot;
 exe=3D&quot;/usr/bin/sudo&quot; hostname=3D? addr=3D? terminal=3D? res=3Ds=
uccess&#39;<br>
Jul 30 15:55:57 x audispd: node=3Dx. type=3DUSER_START msg=3Daudit(15644985=
57.298:457959): pid=3D19690 uid=3D0 auid=3D4294967295 ses=3D4294967295 msg=
=3D&#39;op=3DPAM:session_open grantors=3Dpam_keyinit,pam_systemd,pam_keyini=
t,pam_limits,pam_unix acct=3D&quot;cass_b&quot; exe=3D&quot;/usr/sbin/runus=
er&quot;
 hostname=3D? addr=3D? terminal=3D? res=3Dsuccess&#39;<br>
Jul 30 15:55:58 x systemd: Removed slice User Slice of root.<br>
Jul 30 15:56:02 x cassandra: INFO =C2=A014:56:02 Writing <a href=3D"mailto:=
Memtable-compactions_in_progress@1532791194(0.008KiB" target=3D"_blank">
Memtable-compactions_in_progress@1532791194(0.008KiB</a> serialized bytes, =
1 ops, 0%/0% of on/off-heap limit)<br>
Jul 30 15:56:02 x cassandra: INFO =C2=A014:56:02 Cannot perform a full majo=
r compaction as repaired and unrepaired sstables cannot be compacted togeth=
er. These two set of sstables will be compacted separately.<br>
Jul 30 15:56:02 x cassandra: INFO =C2=A014:56:02 Writing <a href=3D"mailto:=
Memtable-compactions_in_progress@1455399453(0.281KiB" target=3D"_blank">
Memtable-compactions_in_progress@1455399453(0.281KiB</a> serialized bytes, =
16 ops, 0%/0% of on/off-heap limit)<br>
Jul 30 15:56:04 x tag_audit_log: type=3DUSER_CMD msg=3Daudit(1564498555.190=
:457951): pid=3D19294 uid=3D509 auid=3D4294967295 ses=3D4294967295 msg=3D&#=
39;cwd=3D&quot;/&quot; cmd=3D72756E75736572202D73202F62696E2F62617368202D6C=
20636173735F62202D632063617373616E6472612D6D6574612F63617373616E6472612F626=
96E2F6E6F6465746F6F6C2074707374617473
 terminal=3D? res=3Dsuccess&#39;</span><br>
<br>
<br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">We have checked a number of o=
ther things like NTP setting etc but nothing is telling us what could cause=
 so many corruptions across the entire cluster.</span><br>
<span style=3D"font-family:Tahoma,sans-serif">Things were healthy with this=
 cluster for months, the only thing I can think is that we started loading =
data from a load of 20GB per instance up to 200GB where it sits now, maybe =
this just highlighted the issue.</span><br>
<br>
<br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">Compaction and Compression on=
 Keyspace CL&#39;s [mixture]</span><br>
<span style=3D"font-family:Tahoma,sans-serif">All CF&#39;s are using compre=
ssion.</span><br>
<br>
<span style=3D"font-family:&quot;Courier New&quot;">AND compaction =3D {=
9;min_threshold&#39;: &#39;4&#39;, &#39;class&#39;: &#39;org.apache.cassand=
ra.db.compaction.<b>SizeTieredCompactionStrategy</b>&#39;, &#39;max_thresho=
ld&#39;: &#39;32&#39;}<br>
AND compression =3D {&#39;sstable_compression&#39;: &#39;org.apache.cassand=
ra.io.compress.<b>SnappyCompressor</b>&#39;}<br>
<br>
AND compaction =3D {&#39;min_threshold&#39;: &#39;4&#39;, &#39;class&#39;: =
&#39;org.apache.cassandra.db.compaction.<b>SizeTieredCompactionStrategy</b>=
&#39;, &#39;max_threshold&#39;: &#39;32&#39;}<br>
AND compression =3D {&#39;sstable_compression&#39;: &#39;org.apache.cassand=
ra.io.compress.<b>LZ4Compressor</b>&#39;}<br>
<br>
AND compaction =3D {&#39;class&#39;: &#39;org.apache.cassandra.db.compactio=
n.<b>LeveledCompactionStrategy</b>&#39;}<br>
AND compression =3D {&#39;sstable_compression&#39;: &#39;org.apache.cassand=
ra.io.compress.<b>SnappyCompressor</b>&#39;}<br>
</span><br>
<span style=3D"font-family:Tahoma,sans-serif">--We are also using internode=
 network compression:</span><br>
<span style=3D"font-family:&quot;Courier New&quot;">internode_compression: =
all</span><br>
<br>
<br>
<br>
<span style=3D"font-family:Tahoma,sans-serif">Does anyone have any idea wha=
t I should check next?</span><br>
<span style=3D"font-family:Tahoma,sans-serif">Our next theory is that there=
 may be an issue with Checksum, but I&#39;m not sure where to go with this.=
</span><u></u><u></u></p>
</div>
<div>
<p class=3D"MsoNormal"><u></u>=C2=A0<u></u></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif">Any he=
lp would be very much appreciated before I lose the last bit of hair I have=
 on my head.=C2=A0</span><u></u><u></u></p>
</div>
<div>
<p class=3D"MsoNormal"><u></u>=C2=A0<u></u></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif">Kind R=
egards,</span><u></u><u></u></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif">Phil</=
span><u></u><u></u></p>
</div>
</div>
<p class=3D"MsoNormal"><u></u>=C2=A0<u></u></p>
<div>
<div>
<p class=3D"MsoNormal">On Wed, 7 Aug 2019 at 20:51, Nitan Kainth &lt;<a hre=
f=3D"mailto:nitankainth@gmail.com" target=3D"_blank">nitankainth@gmail.com<=
/a>&gt; wrote:<u></u><u></u></p>
</div>
<blockquote style=3D"border-top:none;border-right:none;border-bottom:none;b=
order-left:1pt solid rgb(204,204,204);padding:0in 0in 0in 6pt;margin-left:4=
.8pt;margin-right:0in">
<div>
<p class=3D"MsoNormal">Repair during upgrade have caused corruption too.<u>=
</u><u></u></p>
<div>
<p class=3D"MsoNormal"><u></u>=C2=A0<u></u></p>
</div>
<div>
<p class=3D"MsoNormal" style=3D"margin-bottom:12pt">Also, dropping and addi=
ng columns with same name but different type<u></u><u></u></p>
<div id=3D"gmail-m_2638314099204245784gmail-m_2695334619708952144AppleMailS=
ignature">
<p class=3D"MsoNormal"><u></u>=C2=A0<u></u></p>
<div>
<p class=3D"MsoNormal">Regards,<u></u><u></u></p>
</div>
<div>
<p class=3D"MsoNormal">Nitan<u></u><u></u></p>
<p class=3D"MsoNormal">Cell:=C2=A0<a href=3D"tel:510%20449%209629" target=
=3D"_blank">510 449 9629</a><u></u><u></u></p>
</div>
</div>
<div>
<p class=3D"MsoNormal" style=3D"margin-bottom:12pt"><br>
On Aug 7, 2019, at 2:42 PM, Jeff Jirsa &lt;<a href=3D"mailto:jjirsa@gmail.c=
om" target=3D"_blank">jjirsa@gmail.com</a>&gt; wrote:<u></u><u></u></p>
</div>
<blockquote style=3D"margin-top:5pt;margin-bottom:5pt">
<div>
<p class=3D"MsoNormal">Is compression enabled?<u></u><u></u></p>
<div>
<p class=3D"MsoNormal"><u></u>=C2=A0<u></u></p>
</div>
<div>
<p class=3D"MsoNormal" style=3D"margin-bottom:12pt">If not, bit flips on di=
sk can corrupt data files and reads + repair may send that corruption to ot=
her hosts in the cluster=C2=A0<u></u><u></u></p>
<div>
<p class=3D"MsoNormal" style=3D"margin-bottom:12pt"><br>
On Aug 7, 2019, at 3:46 AM, Philip =C3=93 Cond=C3=BAin &lt;<a href=3D"mailt=
o:philipoconduin@gmail.com" target=3D"_blank">philipoconduin@gmail.com</a>&=
gt; wrote:<u></u><u></u></p>
</div>
<blockquote style=3D"margin-top:5pt;margin-bottom:5pt">
<div>
<div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif">Hi All=
,<br clear=3D"all">
<u></u><u></u></span></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif"><u></u=
>=C2=A0<u></u></span></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif">I am c=
urrently experiencing multiple datafile corruptions across most nodes in my=
 cluster, there seems to be no pattern to the corruption.=C2=A0 I&#39;m sta=
rting to think it might be a bug, we&#39;re using
 Cassandra 2.2.13.<u></u><u></u></span></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif"><u></u=
>=C2=A0<u></u></span></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif">Withou=
t going into detail about the issue I just want to confirm something.<u></u=
><u></u></span></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif"><u></u=
>=C2=A0<u></u></span></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif">Can so=
meone share with me a list of scenarios that would cause corruption?<u></u>=
<u></u></span></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif"><u></u=
>=C2=A0<u></u></span></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif">1. OS =
failure<u></u><u></u></span></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif">2. Cas=
sandra disturbed during the writing=C2=A0<u></u><u></u></span></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif"><u></u=
>=C2=A0<u></u></span></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif">etc et=
c.<u></u><u></u></span></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif"><u></u=
>=C2=A0<u></u></span></p>
</div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Tahoma,sans-serif">I need=
 to investigate each scenario and don&#39;t want to leave any out.<u></u><u=
></u></span></p>
</div>
<div>
<p class=3D"MsoNormal"><u></u>=C2=A0<u></u></p>
</div>
<p class=3D"MsoNormal">-- <u></u><u></u></p>
<div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Verdana,sans-serif">Regar=
ds,</span><u></u><u></u></p>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Verdana,sans-serif">Phil<=
/span><u></u><u></u></p>
</div>
</div>
</div>
</div>
</div>
</blockquote>
</div>
</div>
</blockquote>
</div>
</div>
</blockquote>
</div>
<p class=3D"MsoNormal"><br clear=3D"all">
<u></u><u></u></p>
<div>
<p class=3D"MsoNormal"><u></u>=C2=A0<u></u></p>
</div>
<p class=3D"MsoNormal">-- <u></u><u></u></p>
<div>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Verdana,sans-serif">Regar=
ds,</span><u></u><u></u></p>
<div>
<p class=3D"MsoNormal"><span style=3D"font-family:Verdana,sans-serif">Phil<=
/span><u></u><u></u></p>
</div>
</div>
</div>
</div>
</div>

</blockquote></div><br clear=3D"all"><div><br></div>-- <br><div dir=3D"ltr"=
 class=3D"gmail_signature"><div dir=3D"ltr"><font face=3D"verdana, sans-ser=
if">Regards,</font><div><font face=3D"verdana, sans-serif">Phil</font></div=
></div></div>

--000000000000892f66058f9d962c--