Mailing-List: contact user-help@cassandra.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@cassandra.apache.org
Received-SPF: pass (athena.apache.org: domain of kwright@nanigans.com
 designates 216.82.254.105 as permitted sender)
From: Keith Wright <kwright@nanigans.com>
To: "user@cassandra.apache.org" <user@cassandra.apache.org>
Date: Mon, 5 Aug 2013 10:29:02 -0500
Subject: Re: org.apache.cassandra.io.sstable.CorruptSSTableException
Thread-Topic: org.apache.cassandra.io.sstable.CorruptSSTableException
Thread-Index: Ac6R8H7HzFBEC1JVQuu1pBuo5sFbsw==
Message-ID: <CE253C40.13FC6%kwright@nanigans.com>
In-Reply-To: 
 <CANNkHXZ26C3+aksyvdhCKf3s1Rm3Kh2NiR3KtyPWyoLtuF5a9A@mail.gmail.com>
Accept-Language: en-US
Content-Language: en-US
user-agent: Microsoft-MacOutlook/14.2.3.120616
acceptlanguage: en-US
Content-Type: multipart/alternative;
	boundary="_000_CE253C4013FC6kwrightnaniganscom_"
MIME-Version: 1.0

--_000_CE253C4013FC6kwrightnaniganscom_
Content-Type: text/plain; charset="us-ascii"
Content-Transfer-Encoding: quoted-printable

Thanks for the feedback.  This node actually shut down half way when it was=
 bootstrapping the first time which likely led to this data corruption.  We=
 restarted the JVM and it appeared stable until this issue.  We decided to =
stop cassandra, wipe the node, and restart so that it can bootstrap again t=
o ensure all data is "clean".

From: Ben Coverston <ben.coverston@datastax.com<mailto:ben.coverston@datast=
ax.com>>
Reply-To: "user@cassandra.apache.org<mailto:user@cassandra.apache.org>" <us=
er@cassandra.apache.org<mailto:user@cassandra.apache.org>>
Date: Monday, August 5, 2013 11:23 AM
To: "user@cassandra.apache.org<mailto:user@cassandra.apache.org>" <user@cas=
sandra.apache.org<mailto:user@cassandra.apache.org>>
Subject: Re: org.apache.cassandra.io.sstable.CorruptSSTableException

Also check your system log for IO Errors. Scrub may eliminate the error, bu=
t even if it does work you should still run repair. This type of corruption=
 usually happens because of a failed or failing disk/memory.


On Mon, Aug 5, 2013 at 8:44 AM, Jason Wee <peichieh@gmail.com<mailto:peichi=
eh@gmail.com>> wrote:
you can try nodetool scrub. if it does not work, try repair then cleanup. h=
ad this issue a few weeks back but our version is 1.0.x


On Mon, Aug 5, 2013 at 8:12 AM, Keith Wright <kwright@nanigans.com<mailto:k=
wright@nanigans.com>> wrote:
Re-sending hoping to get some help.  Any ideas would be much appreciated!

From: Keith Wright <kwright@nanigans.com<mailto:kwright@nanigans.com>>
Date: Friday, August 2, 2013 3:01 PM
To: "user@cassandra.apache.org<mailto:user@cassandra.apache.org>" <user@cas=
sandra.apache.org<mailto:user@cassandra.apache.org>>
Subject: org.apache.cassandra.io.sstable.CorruptSSTableException

Hi all,

   We just added a node to our cluster (1.2.4 Vnodes) and they appear to be=
 running well exception I see that the new node is not making any progress =
compacting one of the CF.  The exception below is generated.  My assumption=
 is that the only way to handle this is to stop the node, delete the file i=
n question, restart, and run repair.

Thoughts?

org.apache.cassandra.io.sstable.CorruptSSTableException: java.io.IOExceptio=
n: dataSize of 1249463589142530 starting at 5604968 would be larger than fi=
le /data/3/cassandra/data/users/global_user/users-global_user-ib-1550-Data.=
db length 14017479
        at org.apache.cassandra.io.sstable.SSTableIdentityIterator.<init>(S=
STableIdentityIterator.java:168)
        at org.apache.cassandra.io.sstable.SSTableIdentityIterator.<init>(S=
STableIdentityIterator.java:83)
        at org.apache.cassandra.io.sstable.SSTableIdentityIterator.<init>(S=
STableIdentityIterator.java:69)
        at org.apache.cassandra.io.sstable.SSTableScanner$KeyScanningIterat=
or.next(SSTableScanner.java:177)
        at org.apache.cassandra.io.sstable.SSTableScanner$KeyScanningIterat=
or.next(SSTableScanner.java:152)
        at org.apache.cassandra.io.sstable.SSTableScanner.next(SSTableScann=
er.java:139)
        at org.apache.cassandra.io.sstable.SSTableScanner.next(SSTableScann=
er.java:36)
        at org.apache.cassandra.db.compaction.ParallelCompactionIterable$De=
serializer$1.runMayThrow(ParallelCompactionIterable.java:288)
        at org.apache.cassandra.utils.WrappedRunnable.run(WrappedRunnable.j=
ava:28)
        at java.lang.Thread.run(Thread.java:722)
Caused by: java.io.IOException: dataSize of 1249463589142530 starting at 56=
04968 would be larger than file /data/3/cassandra/data/users/global_user/us=
ers-global_user-ib-1550-Data.db length 14017479
        at org.apache.cassandra.io.sstable.SSTableIdentityIterator.<init>(S=
STableIdentityIterator.java:123)
        ... 9 more


--
Ben Coverston
DataStax -- The Apache Cassandra Company

--_000_CE253C4013FC6kwrightnaniganscom_
Content-Type: text/html; charset="us-ascii"
Content-Transfer-Encoding: quoted-printable

<html><head></head><body style=3D"word-wrap: break-word; -webkit-nbsp-mode:=
 space; -webkit-line-break: after-white-space; color: rgb(0, 0, 0); font-si=
ze: 14px; font-family: Calibri, sans-serif; "><div>Thanks for the feedback.=
 &nbsp;This node actually shut down half way when it was bootstrapping the =
first time which likely led to this data corruption. &nbsp;We restarted the=
 JVM and it appeared stable until this issue. &nbsp;We decided to stop cass=
andra, wipe the node, and restart so that it can bootstrap again to ensure =
all data is "clean".</div><div><br></div><span id=3D"OLK_SRC_BODY_SECTION">=
<div style=3D"font-family:Calibri; font-size:11pt; text-align:left; color:b=
lack; BORDER-BOTTOM: medium none; BORDER-LEFT: medium none; PADDING-BOTTOM:=
 0in; PADDING-LEFT: 0in; PADDING-RIGHT: 0in; BORDER-TOP: #b5c4df 1pt solid;=
 BORDER-RIGHT: medium none; PADDING-TOP: 3pt"><span style=3D"font-weight:bo=
ld">From: </span> Ben Coverston &lt;<a href=3D"mailto:ben.coverston@datasta=
x.com">ben.coverston@datastax.com</a>&gt;<br><span style=3D"font-weight:bol=
d">Reply-To: </span> "<a href=3D"mailto:user@cassandra.apache.org">user@cas=
sandra.apache.org</a>" &lt;<a href=3D"mailto:user@cassandra.apache.org">use=
r@cassandra.apache.org</a>&gt;<br><span style=3D"font-weight:bold">Date: </=
span> Monday, August 5, 2013 11:23 AM<br><span style=3D"font-weight:bold">T=
o: </span> "<a href=3D"mailto:user@cassandra.apache.org">user@cassandra.apa=
che.org</a>" &lt;<a href=3D"mailto:user@cassandra.apache.org">user@cassandr=
a.apache.org</a>&gt;<br><span style=3D"font-weight:bold">Subject: </span> R=
e: org.apache.cassandra.io.sstable.CorruptSSTableException<br></div><div><b=
r></div><div><meta http-equiv=3D"Content-Type" content=3D"text/html; charse=
t=3Dutf-8"><div><div dir=3D"ltr">Also check your system log for IO Errors. =
Scrub may eliminate the error, but even if it does work you should still ru=
n repair. This type of corruption usually happens because of a failed or fa=
iling disk/memory.</div><div class=3D"gmail_extra"><br><br><div class=3D"gm=
ail_quote">On Mon, Aug 5, 2013 at 8:44 AM, Jason Wee <span dir=3D"ltr">
&lt;<a href=3D"mailto:peichieh@gmail.com" target=3D"_blank">peichieh@gmail.=
com</a>&gt;</span> wrote:<br><blockquote class=3D"gmail_quote" style=3D"mar=
gin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir=3D"ltr=
">you can try nodetool scrub. if it does not work, try repair then cleanup.=
 had this issue a few weeks back but our version is 1.0.x</div><div class=
=3D"HOEnZb"><div class=3D"h5"><div class=3D"gmail_extra"><br><br><div class=
=3D"gmail_quote">On Mon, Aug 5, 2013 at 8:12 AM, Keith Wright <span dir=3D"=
ltr">
&lt;<a href=3D"mailto:kwright@nanigans.com" target=3D"_blank">kwright@nanig=
ans.com</a>&gt;</span> wrote:<br><blockquote class=3D"gmail_quote" style=3D=
"margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style=
=3D"font-size:14px;font-family:Calibri,sans-serif;word-wrap:break-word"><di=
v>Re-sending hoping to get some help. &nbsp;Any ideas would be much appreci=
ated!</div><div><br></div><span><div style=3D"border-right:medium none;padd=
ing-right:0in;padding-left:0in;padding-top:3pt;text-align:left;font-size:11=
pt;border-bottom:medium none;font-family:Calibri;border-top:#b5c4df 1pt sol=
id;padding-bottom:0in;border-left:medium none"><span style=3D"font-weight:b=
old">From: </span>Keith Wright &lt;<a href=3D"mailto:kwright@nanigans.com" =
target=3D"_blank">kwright@nanigans.com</a>&gt;<br><span style=3D"font-weigh=
t:bold">Date: </span>Friday, August 2, 2013 3:01 PM<br><span style=3D"font-=
weight:bold">To: </span>"<a href=3D"mailto:user@cassandra.apache.org" targe=
t=3D"_blank">user@cassandra.apache.org</a>" &lt;<a href=3D"mailto:user@cass=
andra.apache.org" target=3D"_blank">user@cassandra.apache.org</a>&gt;<br><s=
pan style=3D"font-weight:bold">Subject: </span>org.apache.cassandra.io.ssta=
ble.CorruptSSTableException<br></div><div><br></div><div><div style=3D"font=
-size:14px;font-family:Calibri,sans-serif;word-wrap:break-word"><div><div>H=
i all,</div><div><br></div><div>&nbsp; &nbsp;We just added a node to our cl=
uster (1.2.4 Vnodes) and they appear to be running well exception I see tha=
t the new node is not making any progress compacting one of the CF. &nbsp;T=
he exception below is generated. &nbsp;My assumption is that the only way t=
o handle
 this is to stop the node, delete the file in question, restart, and run re=
pair.</div><div><br></div><div>Thoughts?</div><div><br></div><div>org.apach=
e.cassandra.io.sstable.CorruptSSTableException: java.io.IOException: dataSi=
ze of 1249463589142530 starting at 5604968 would be larger than file /data/=
3/cassandra/data/users/global_user/users-global_user-ib-1550-Data.db length=
 14017479</div><div>&nbsp; &nbsp; &nbsp; &nbsp; at org.apache.cassandra.io.=
sstable.SSTableIdentityIterator.&lt;init&gt;(SSTableIdentityIterator.java:1=
68)</div><div>&nbsp; &nbsp; &nbsp; &nbsp; at org.apache.cassandra.io.sstabl=
e.SSTableIdentityIterator.&lt;init&gt;(SSTableIdentityIterator.java:83)</di=
v><div>&nbsp; &nbsp; &nbsp; &nbsp; at org.apache.cassandra.io.sstable.SSTab=
leIdentityIterator.&lt;init&gt;(SSTableIdentityIterator.java:69)</div><div>=
&nbsp; &nbsp; &nbsp; &nbsp; at org.apache.cassandra.io.sstable.SSTableScann=
er$KeyScanningIterator.next(SSTableScanner.java:177)</div><div>&nbsp; &nbsp=
; &nbsp; &nbsp; at org.apache.cassandra.io.sstable.SSTableScanner$KeyScanni=
ngIterator.next(SSTableScanner.java:152)</div><div>&nbsp; &nbsp; &nbsp; &nb=
sp; at org.apache.cassandra.io.sstable.SSTableScanner.next(SSTableScanner.j=
ava:139)</div><div>&nbsp; &nbsp; &nbsp; &nbsp; at org.apache.cassandra.io.s=
stable.SSTableScanner.next(SSTableScanner.java:36)</div><div>&nbsp; &nbsp; =
&nbsp; &nbsp; at org.apache.cassandra.db.compaction.ParallelCompactionItera=
ble$Deserializer$1.runMayThrow(ParallelCompactionIterable.java:288)</div><d=
iv>&nbsp; &nbsp; &nbsp; &nbsp; at org.apache.cassandra.utils.WrappedRunnabl=
e.run(WrappedRunnable.java:28)</div><div>&nbsp; &nbsp; &nbsp; &nbsp; at jav=
a.lang.Thread.run(Thread.java:722)</div><div>Caused by: java.io.IOException=
: dataSize of 1249463589142530 starting at 5604968 would be larger than fil=
e /data/3/cassandra/data/users/global_user/users-global_user-ib-1550-Data.d=
b length 14017479</div><div>&nbsp; &nbsp; &nbsp; &nbsp; at org.apache.cassa=
ndra.io.sstable.SSTableIdentityIterator.&lt;init&gt;(SSTableIdentityIterato=
r.java:123)</div><div>&nbsp; &nbsp; &nbsp; &nbsp; ... 9 more</div></div><di=
v><br></div></div></div></span></div></blockquote></div><br></div></div></d=
iv></blockquote></div><br><br clear=3D"all"><div><br></div>
-- <br>
Ben Coverston
<div>DataStax -- The Apache Cassandra Company</div></div></div></div></span=
></body></html>

--_000_CE253C4013FC6kwrightnaniganscom_--