Mailing-List: contact user-help@cassandra.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@cassandra.apache.org
MIME-Version: 1.0
References: <CALwotiHchuC4jijn2b4L-ggosrG3Oq+Nfs-qkvYyY4Ubv0aYcQ@mail.gmail.com>
 <CAHkQdMiSzGgPXvSuu1sNmkjoK8=13rvZqjX7dE6SeBz3rkBDnA@mail.gmail.com>
 <CADQ6LYkUT=3R4FcaWaBnQ+N51m9P0fwtFOstPSPO+-OAS0Lgmw@mail.gmail.com>
 <CALwotiFEi_8iwXgs-niA0VHc6QGpU-3d=LMnTxnTAJ6VFiNWgw@mail.gmail.com> <CADQ6LY=y83Sh7CweaYCefx-nxx-fvTwstrppGO_MHorzj6G_Uw@mail.gmail.com>
In-Reply-To: <CADQ6LY=y83Sh7CweaYCefx-nxx-fvTwstrppGO_MHorzj6G_Uw@mail.gmail.com>
From: Alexander Dejanovski <alex@thelastpickle.com>
Date: Wed, 04 Jan 2017 15:56:19 +0000
Message-ID: <CAHkQdMjmffScC36DqaBiBfsOT0iYBFx_zDVTdErsuYLfLRnGDw@mail.gmail.com>
Subject: Re: Reaper repair seems to "hang"
To: user@cassandra.apache.org
Content-Type: multipart/alternative; boundary=001a114dc2a4fa0e90054546d324
archived-at: Wed, 04 Jan 2017 15:56:43 -0000

--001a114dc2a4fa0e90054546d324
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: quoted-printable

Actually, the problem is related to CASSANDRA-11430
<https://issues.apache.org/jira/browse/CASSANDRA-11430>.

Before 2.2.6, the notification service did not work with newly deprecated
repair methods, on which Reaper still currently relies.
C* 2.2.6 and onwards are not affected by this problem and work fine with
Reaper.

We're working on switching to the new repair method for 2.2 and 3.0/3.x,
which should be ready in a few days/weeks.

When using incremental repair, watch out for CASSANDRA-11696 which was
fixed in C* 2.1.15, 2.2.7, 3.0.8 and 3.8. In prior versions, unrepaired
SSTables can be marked as repaired, and thus never be repaired.

Cheers,


On Wed, Jan 4, 2017 at 6:09 AM Bhuvan Rawal <bhu1rawal@gmail.com> wrote:

> Hi Daniel,
>
> Looks like yours is a different case. If you're running incremental repai=
r
> for the first time it make take long time esp. if table is large. And
> repair may seem to stuck even when things are working.
>
> You can try nodetool compactionstats when repair appears stuck, you'll
> find a validation compaction happening if that's indeed the case.
>
> For the first incremental repair you can follow this doc, in further
> repairs incremental repair should encounter very few sstables:
>
> https://docs.datastax.com/en/cassandra/2.1/cassandra/operations/opsRepair=
NodesMigration.html
>
> Regards,
> Bhuvan
>
>
>
> On Jan 4, 2017 3:52 AM, "Daniel Kleviansky" <daniel@kleviansky.com> wrote=
:
>
> Hi Bhuvan,
>
> Thank you so very much for your detailed reply.
> Just to ensure everyone is across the same information, and responses are
> not duplicated across two different forums, I thought I'd share with the
> mailing list that I've created a GitHub issue at:
> https://github.com/thelastpickle/cassandra-reaper/issues/39
>
> Kind regards,
> Daniel
>
> On Wed, Jan 4, 2017 at 6:31 AM, Bhuvan Rawal <bhu1rawal@gmail.com> wrote:
>
> Hi Daniel,
>
> We faced a similar issue during repair with reaper. We ran repair with
> more repair threads than number of cassandra nodes. But on and off repair
> was getting stuck and we had to do rolling restart of cluster or wait for
> lock time to expire (~1hr).
>
> We had a look at the stuck repair, threadpools were getting stuck at
> AntiEntropy stage. From the synchronized block in repair code it appeared
> that per node at max 1 concurrent repair session per node is possible.
>
> According to
> https://medium.com/@mlowicki/cassandra-reaper-introduction-ed73410492bf#.=
f0erygqpk
>  :
>
> Segment runner has protection mechanism to avoid overloading nodes using
> two simple rules to postpone repair if:
>
> 1. Number of pending compactions is greater than *MAX_PENDING_COMPACTIONS=
* (20
> by default)
> *2. Node is already running repair job*
>
> We tried running reaper with number of threads less than number of nodes
> (assuming reaper will not submit multiple segments to single cassandra
> node) but still it was observed that multiple repair segments were going =
to
> same node concurrently and threfore chances of nodes getting stuck in tha=
t
> state was possible. Finally we settled with single repair thread in reape=
r
> settings. Although takes a slightly more time but has completed
> successfully numerous times.
>
> Thread Dump of cassandra server when repair was getting stuck:
>
> "*AntiEntropyStage:1" #159 daemon prio=3D5 os_prio=3D0 tid=3D0x00007f0fa1=
6226a0
> nid=3D0x3c82 waiting for monitor entry [0x00007ee9eabaf000*]
>    java.lang.Thread.State: BLOCKED (*on object monitor*)
>         at
> org.apache.cassandra.service.ActiveRepairService.removeParentRepairSessio=
n(ActiveRepairService.java:392)
>         - waiting to lock <0x000000067c083308> (a
> org.apache.cassandra.service.ActiveRepairService)
>         at
> org.apache.cassandra.service.ActiveRepairService.doAntiCompaction(ActiveR=
epairService.java:417)
>         at org.apache.cassandra.repair
> .RepairMessageVerbHandler.doVerb(RepairMessageVerbHandler.java:145)
>         at org.apache.cassandra.net
> .MessageDeliveryTask.run(MessageDeliveryTask.java:67)
>         at
> java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
>         at java.util.concurrent.FutureTask.run(FutureTask.java:266)
>         at
> java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java=
:1142)
>
> Hope it helps!
>
> Regards,
> Bhuvan
>
> According to
> https://medium.com/@mlowicki/cassandra-reaper-introduction-ed73410492bf#.=
f0erygqpk
>  :
>
> Segment runner has protection mechanism to avoid overloading nodes using
> two simple rules to postpone repair if:
>
> 1. Number of pending compactions is greater than *MAX_PENDING_COMPACTIONS=
* (20
> by default)
> 2. Node is already running repair job
>
>
> On Tue, Jan 3, 2017 at 11:16 AM, Alexander Dejanovski <
> alex@thelastpickle.com> wrote:
>
> Hi Daniel,
>
> could you file a bug in the issue tracker ?
> https://github.com/thelastpickle/cassandra-reaper/issues
>
> We'll figure out what's wrong and get your repairs running.
>
> Thanks !
>
> On Tue, Jan 3, 2017 at 12:35 AM Daniel Kleviansky <daniel@kleviansky.com>
> wrote:
>
> Hi everyone,
>
> Using The Last Pickle's fork of Reaper, and unfortunately running into a
> bit of an issue. I'll try break it down below.
>
> # Problem Description:
> * After starting repair via the GUI, progress remains at 0/x.
> * Cassandra nodes calculate their respective token ranges, and then
> nothing happens.
> * There were no errors in the Reaper or Cassandra logs. Only a message of
> acknowledgement that a repair had initiated.
> * Performing stack trace on the running JVM, once can see that the thread
> spawning the repair process was waiting on a lock that was never being
> released.
> * This occurred on all nodes, and prevented any manually initiated repair
> process from running. A rolling restart of each node was required, after
> which one could run a `nodetool repair` successfully.
>
> # Cassandra Cluster Details:
> * Cassandra 2.2.5 running on Windows Server 2008 R2
> * 6 node cluster, split across 2 DCs, with RF =3D 3:3.
>
> # Reaper Details:
> * Reaper 0.3.3 running on Windows Server 2008 R2, utilising a PostgreSQL
> database.
>
> ## Reaper settings:
> * Parallism: DC-Aware
> * Repair Intensity: 0.9
> * Incremental: true
>
> Don't want to swamp you with more details or unnecessary logs, especially
> as I'd have to sanitize them before sending them out, so please let me kn=
ow
> if there is anything else I can provide, and I'll do my best to get it to
> you.
>
> =E2=80=8BKind regards,
> Daniel
>
> --
> -----------------
> Alexander Dejanovski
> France
> @alexanderdeja
>
> Consultant
> Apache Cassandra Consulting
> http://www.thelastpickle.com
>
>
>
>
>
> --
> Daniel Kleviansky
> System Engineer & CX Consultant
> M: +61 (0) 499 103 043 <+61%20499%20103%20043> | E: daniel@kleviansky.com
> | W: http://danielkleviansky.com
>
>
> --
-----------------
Alexander Dejanovski
France
@alexanderdeja

Consultant
Apache Cassandra Consulting
http://www.thelastpickle.com

--001a114dc2a4fa0e90054546d324
Content-Type: text/html; charset=UTF-8
Content-Transfer-Encoding: quoted-printable

<div dir=3D"ltr">Actually, the problem is related to=C2=A0<a href=3D"https:=
//issues.apache.org/jira/browse/CASSANDRA-11430" style=3D"box-sizing:border=
-box;color:rgb(64,120,192);outline-width:0px;font-family:-apple-system,blin=
kmacsystemfont,&quot;segoe ui&quot;,helvetica,arial,sans-serif,&quot;apple =
color emoji&quot;,&quot;segoe ui emoji&quot;,&quot;segoe ui symbol&quot;;fo=
nt-size:14px">CASSANDRA-11430</a><font color=3D"#333333" face=3D"-apple-sys=
tem, blinkmacsystemfont, segoe ui, helvetica, arial, sans-serif, apple colo=
r emoji, segoe ui emoji, segoe ui symbol"><span style=3D"font-size:14px">.<=
/span></font><div><font color=3D"#333333" face=3D"-apple-system, blinkmacsy=
stemfont, segoe ui, helvetica, arial, sans-serif, apple color emoji, segoe =
ui emoji, segoe ui symbol"><span style=3D"font-size:14px"><br></span></font=
></div>Before 2.2.6, the notification service did not work with newly depre=
cated repair methods, on which Reaper still currently relies.<br>C* 2.2.6 a=
nd onwards are not affected by this problem and work fine with Reaper.<br><=
br>We&#39;re working on switching to the new repair method for 2.2 and 3.0/=
3.x, which should be ready in a few days/weeks.<div><br></div><div>When usi=
ng incremental repair, watch out for=C2=A0CASSANDRA-11696 which was fixed i=
n C* 2.1.15, 2.2.7, 3.0.8 and 3.8. In prior versions, unrepaired SSTables c=
an be marked as repaired, and thus never be repaired.<br>=C2=A0 <div>Cheers=
,</div><div><br></div><div><br></div></div></div><br><div class=3D"gmail_qu=
ote"><div dir=3D"ltr">On Wed, Jan 4, 2017 at 6:09 AM Bhuvan Rawal &lt;<a hr=
ef=3D"mailto:bhu1rawal@gmail.com">bhu1rawal@gmail.com</a>&gt; wrote:<br></d=
iv><blockquote class=3D"gmail_quote" style=3D"margin:0 0 0 .8ex;border-left=
:1px #ccc solid;padding-left:1ex"><div dir=3D"auto" class=3D"gmail_msg">Hi =
Daniel,<div dir=3D"auto" class=3D"gmail_msg"><br class=3D"gmail_msg"></div>=
<div dir=3D"auto" class=3D"gmail_msg">Looks like yours is a different case.=
 If you&#39;re running incremental repair for the first time it make take l=
ong time esp. if table is large. And repair may seem to stuck even when thi=
ngs are working.=C2=A0</div><div dir=3D"auto" class=3D"gmail_msg"><br class=
=3D"gmail_msg"></div><div dir=3D"auto" class=3D"gmail_msg">You can try node=
tool compactionstats when repair appears stuck, you&#39;ll find a validatio=
n compaction happening if that&#39;s indeed the case.=C2=A0</div><div dir=
=3D"auto" class=3D"gmail_msg"><br class=3D"gmail_msg"></div><div dir=3D"aut=
o" class=3D"gmail_msg">For the first incremental repair you can follow this=
 doc, in further repairs incremental repair should encounter very few sstab=
les:</div><div dir=3D"auto" class=3D"gmail_msg"><a href=3D"https://docs.dat=
astax.com/en/cassandra/2.1/cassandra/operations/opsRepairNodesMigration.htm=
l" class=3D"gmail_msg" target=3D"_blank">https://docs.datastax.com/en/cassa=
ndra/2.1/cassandra/operations/opsRepairNodesMigration.html</a><br class=3D"=
gmail_msg"></div><div dir=3D"auto" class=3D"gmail_msg"><br class=3D"gmail_m=
sg"></div><div dir=3D"auto" class=3D"gmail_msg">Regards,</div><div dir=3D"a=
uto" class=3D"gmail_msg">Bhuvan</div></div><div dir=3D"auto" class=3D"gmail=
_msg"><div dir=3D"auto" class=3D"gmail_msg"><br class=3D"gmail_msg"></div><=
br class=3D"gmail_msg"><div class=3D"gmail_extra gmail_msg" dir=3D"auto"><b=
r class=3D"gmail_msg"><div class=3D"gmail_quote gmail_msg">On Jan 4, 2017 3=
:52 AM, &quot;Daniel Kleviansky&quot; &lt;<a href=3D"mailto:daniel@klevians=
ky.com" class=3D"gmail_msg" target=3D"_blank">daniel@kleviansky.com</a>&gt;=
 wrote:<br type=3D"attribution" class=3D"gmail_msg"><blockquote class=3D"m_=
-171119062601029426quote gmail_msg" style=3D"margin:0 0 0 .8ex;border-left:=
1px #ccc solid;padding-left:1ex"><div dir=3D"ltr" class=3D"gmail_msg"><div =
class=3D"gmail_default gmail_msg" style=3D"font-family:tahoma,sans-serif">H=
i Bhuvan,</div><div class=3D"gmail_default gmail_msg" style=3D"font-family:=
tahoma,sans-serif"><br class=3D"gmail_msg"></div><div class=3D"gmail_defaul=
t gmail_msg" style=3D"font-family:tahoma,sans-serif">Thank you so very much=
 for your detailed reply.</div><div class=3D"gmail_default gmail_msg" style=
=3D"font-family:tahoma,sans-serif">Just to ensure everyone is across the sa=
me information, and responses are not duplicated across two different forum=
s, I thought I&#39;d share with the mailing list that I&#39;ve created a Gi=
tHub issue at:=C2=A0<a href=3D"https://github.com/thelastpickle/cassandra-r=
eaper/issues/39" class=3D"gmail_msg" target=3D"_blank">https://github.com/t=
helastpickle/cassandra-reaper/issues/39</a></div><div class=3D"gmail_defaul=
t gmail_msg" style=3D"font-family:tahoma,sans-serif"><br class=3D"gmail_msg=
"></div><div class=3D"gmail_default gmail_msg" style=3D"font-family:tahoma,=
sans-serif">Kind regards,</div><div class=3D"gmail_default gmail_msg" style=
=3D"font-family:tahoma,sans-serif">Daniel</div><div class=3D"gmail_extra gm=
ail_msg"><div class=3D"m_-171119062601029426elided-text gmail_msg"><br clas=
s=3D"gmail_msg"><div class=3D"gmail_quote gmail_msg">On Wed, Jan 4, 2017 at=
 6:31 AM, Bhuvan Rawal <span dir=3D"ltr" class=3D"gmail_msg">&lt;<a href=3D=
"mailto:bhu1rawal@gmail.com" class=3D"gmail_msg" target=3D"_blank">bhu1rawa=
l@gmail.com</a>&gt;</span> wrote:<br class=3D"gmail_msg"><blockquote class=
=3D"gmail_quote gmail_msg" style=3D"margin:0 0 0 .8ex;border-left:1px #ccc =
solid;padding-left:1ex"><div dir=3D"ltr" class=3D"gmail_msg">Hi Daniel,<div=
 class=3D"gmail_msg"><br class=3D"gmail_msg"></div><div class=3D"gmail_msg"=
>We faced a similar issue during repair with reaper. We ran repair with mor=
e repair threads than number of cassandra nodes. But on and off repair was =
getting stuck and we had to do rolling restart of cluster or wait for lock =
time to expire (~1hr).=C2=A0</div><div class=3D"gmail_msg"><br class=3D"gma=
il_msg"></div><div class=3D"gmail_msg">We had a look at the stuck repair, t=
hreadpools were getting stuck at AntiEntropy stage. From the synchronized b=
lock in repair code it appeared that per node at max 1 concurrent repair se=
ssion per node is possible.=C2=A0</div><div class=3D"gmail_msg"><br class=
=3D"gmail_msg"></div><div class=3D"gmail_msg"><span style=3D"font-size:12.8=
px" class=3D"gmail_msg">According to=C2=A0</span><a href=3D"https://medium.=
com/@mlowicki/cassandra-reaper-introduction-ed73410492bf#.f0erygqpk" style=
=3D"font-size:12.8px" class=3D"gmail_msg" target=3D"_blank">https://medium.=
com/@mlowicki/cassandra-reaper-introduction-ed73410492bf#.f0erygqpk</a><spa=
n style=3D"font-size:12.8px" class=3D"gmail_msg">=C2=A0:</span></div><div c=
lass=3D"gmail_msg"><span style=3D"font-size:12.8px" class=3D"gmail_msg"><br=
 class=3D"gmail_msg"></span><div style=3D"font-size:12.8px" class=3D"gmail_=
msg"><span style=3D"color:rgba(0,0,0,0.8);font-family:medium-content-serif-=
font,georgia,cambria,&quot;times new roman&quot;,times,serif;letter-spacing=
:-0.003em" class=3D"gmail_msg">Segment runner has protection mechanism to a=
void overloading nodes using two simple rules to postpone=C2=A0<span class=
=3D"m_-171119062601029426m_-5310370434740979426m_-4766757875583002751gmail-=
il gmail_msg">repair</span>=C2=A0if:=C2=A0</span></div><div style=3D"font-s=
ize:12.8px" class=3D"gmail_msg"><span style=3D"font-family:medium-content-s=
erif-font,georgia,cambria,&quot;times new roman&quot;,times,serif;letter-sp=
acing:-0.003em;color:rgba(0,0,0,0.8)" class=3D"gmail_msg"><br class=3D"gmai=
l_msg"></span></div><div style=3D"font-size:12.8px" class=3D"gmail_msg"><sp=
an style=3D"font-family:medium-content-serif-font,georgia,cambria,&quot;tim=
es new roman&quot;,times,serif;letter-spacing:-0.003em;color:rgba(0,0,0,0.8=
)" class=3D"gmail_msg">1. Number of pending compactions is greater than=C2=
=A0</span><em class=3D"m_-171119062601029426m_-5310370434740979426m_-476675=
7875583002751gmail-m_3049142694580412350gmail-markup--em m_-171119062601029=
426m_-5310370434740979426m_-4766757875583002751gmail-m_3049142694580412350g=
mail-markup--li-em gmail_msg" style=3D"font-family:medium-content-serif-fon=
t,georgia,cambria,&quot;times new roman&quot;,times,serif;letter-spacing:-0=
.003em;color:rgba(0,0,0,0.8);font-feature-settings:&#39;liga&#39; 1,&#39;sa=
lt&#39; 1">MAX_PENDING_COMPACTIONS</em><span style=3D"font-family:medium-co=
ntent-serif-font,georgia,cambria,&quot;times new roman&quot;,times,serif;le=
tter-spacing:-0.003em;color:rgba(0,0,0,0.8)" class=3D"gmail_msg">=C2=A0(20 =
by default)</span></div><div style=3D"font-size:12.8px" class=3D"gmail_msg"=
><span style=3D"font-family:medium-content-serif-font,georgia,cambria,&quot=
;times new roman&quot;,times,serif;letter-spacing:-0.003em;color:rgba(0,0,0=
,0.8)" class=3D"gmail_msg"><b class=3D"gmail_msg">2. Node is already runnin=
g=C2=A0<span class=3D"m_-171119062601029426m_-5310370434740979426m_-4766757=
875583002751gmail-il gmail_msg">repair</span>=C2=A0job</b></span></div></di=
v><div class=3D"gmail_msg"><br class=3D"gmail_msg"></div><div class=3D"gmai=
l_msg">We tried running reaper with number of threads less than number of n=
odes (assuming reaper will not submit multiple segments to single cassandra=
 node) but still it was observed that multiple repair segments were going t=
o same node concurrently and threfore chances of nodes getting stuck in tha=
t state was possible. Finally we settled with single repair thread in reape=
r settings. Although takes a slightly more time but has completed successfu=
lly numerous times.</div><div class=3D"gmail_msg"><br class=3D"gmail_msg"><=
/div><div class=3D"gmail_msg">Thread Dump of cassandra server when repair w=
as getting stuck:</div><div class=3D"gmail_msg"><br class=3D"gmail_msg"></d=
iv><div class=3D"gmail_msg"><div style=3D"font-size:12.8px" class=3D"gmail_=
msg"><font face=3D"monospace, monospace" class=3D"gmail_msg">&quot;<b class=
=3D"gmail_msg">AntiEntropyStage:1&quot; #159 daemon prio=3D5 os_prio=3D0 ti=
d=3D0x00007f0fa16226a0 nid=3D0x3c82 waiting for monitor entry [0x00007ee9ea=
baf000</b>]</font></div><div style=3D"font-size:12.8px" class=3D"gmail_msg"=
><font face=3D"monospace, monospace" class=3D"gmail_msg">=C2=A0 =C2=A0java.=
lang.Thread.State: BLOCKED (<b class=3D"gmail_msg">on object monitor</b>)</=
font></div><div style=3D"font-size:12.8px" class=3D"gmail_msg"><font face=
=3D"monospace, monospace" class=3D"gmail_msg">=C2=A0 =C2=A0 =C2=A0 =C2=A0 a=
t org.apache.cassandra.service.ActiveRepairService.removeParentRepairSessio=
n(ActiveRepairService.java:392)</font></div><div style=3D"font-size:12.8px"=
 class=3D"gmail_msg"><font face=3D"monospace, monospace" class=3D"gmail_msg=
">=C2=A0 =C2=A0 =C2=A0 =C2=A0 - waiting to lock &lt;0x000000067c083308&gt; =
(a org.apache.cassandra.service.ActiveRepairService)</font></div><div style=
=3D"font-size:12.8px" class=3D"gmail_msg"><font face=3D"monospace, monospac=
e" class=3D"gmail_msg">=C2=A0 =C2=A0 =C2=A0 =C2=A0 at org.apache.cassandra.=
service.ActiveRepairService.doAntiCompaction(ActiveRepairService.java:417)<=
/font></div><div style=3D"font-size:12.8px" class=3D"gmail_msg"><font face=
=3D"monospace, monospace" class=3D"gmail_msg">=C2=A0 =C2=A0 =C2=A0 =C2=A0 a=
t org.apache.cassandra.<span class=3D"m_-171119062601029426m_-5310370434740=
979426m_-4766757875583002751gmail-il gmail_msg">repair</span>.RepairMessage=
VerbHandler.doVerb(RepairMessageVerbHandler.java:145)</font></div><div styl=
e=3D"font-size:12.8px" class=3D"gmail_msg"><font face=3D"monospace, monospa=
ce" class=3D"gmail_msg">=C2=A0 =C2=A0 =C2=A0 =C2=A0 at <a href=3D"http://or=
g.apache.cassandra.net" class=3D"gmail_msg" target=3D"_blank">org.apache.ca=
ssandra.net</a>.MessageDeliveryTask.run(MessageDeliveryTask.java:67)</font>=
</div><div style=3D"font-size:12.8px" class=3D"gmail_msg"><font face=3D"mon=
ospace, monospace" class=3D"gmail_msg">=C2=A0 =C2=A0 =C2=A0 =C2=A0 at java.=
util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)</font></=
div><div style=3D"font-size:12.8px" class=3D"gmail_msg"><font face=3D"monos=
pace, monospace" class=3D"gmail_msg">=C2=A0 =C2=A0 =C2=A0 =C2=A0 at java.ut=
il.concurrent.FutureTask.run(FutureTask.java:266)</font></div><div style=3D=
"font-size:12.8px" class=3D"gmail_msg"><font face=3D"monospace, monospace" =
class=3D"gmail_msg">=C2=A0 =C2=A0 =C2=A0 =C2=A0 at java.util.concurrent.Thr=
eadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)</font></div></div><=
div class=3D"gmail_msg"><font face=3D"monospace, monospace" class=3D"gmail_=
msg"><br class=3D"gmail_msg"></font></div><div class=3D"gmail_msg">Hope it =
helps!</div><div class=3D"gmail_msg"><br class=3D"gmail_msg"></div><div cla=
ss=3D"gmail_msg">Regards,</div><div class=3D"gmail_msg">Bhuvan</div><div cl=
ass=3D"gmail_msg"><span style=3D"font-size:12.8px" class=3D"gmail_msg"><br =
class=3D"gmail_msg"></span></div><div class=3D"gmail_msg"><span style=3D"fo=
nt-size:12.8px" class=3D"gmail_msg">According to=C2=A0</span><a href=3D"htt=
ps://medium.com/@mlowicki/cassandra-reaper-introduction-ed73410492bf#.f0ery=
gqpk" style=3D"font-size:12.8px" class=3D"gmail_msg" target=3D"_blank">http=
s://medium.com/@mlowicki/cassandra-reaper-introduction-ed73410492bf#.f0eryg=
qpk</a><span style=3D"font-size:12.8px" class=3D"gmail_msg">=C2=A0:</span><=
/div><div style=3D"font-size:12.8px" class=3D"gmail_msg"><span style=3D"col=
or:rgba(0,0,0,0.8);font-family:medium-content-serif-font,georgia,cambria,&q=
uot;times new roman&quot;,times,serif;letter-spacing:-0.003em" class=3D"gma=
il_msg"><br class=3D"gmail_msg"></span></div><div style=3D"font-size:12.8px=
" class=3D"gmail_msg"><span style=3D"color:rgba(0,0,0,0.8);font-family:medi=
um-content-serif-font,georgia,cambria,&quot;times new roman&quot;,times,ser=
if;letter-spacing:-0.003em" class=3D"gmail_msg">Segment runner has protecti=
on mechanism to avoid overloading nodes using two simple rules to postpone=
=C2=A0<span class=3D"m_-171119062601029426m_-5310370434740979426m_-47667578=
75583002751gmail-il gmail_msg">repair</span>=C2=A0if:=C2=A0</span></div><di=
v style=3D"font-size:12.8px" class=3D"gmail_msg"><span style=3D"font-family=
:medium-content-serif-font,georgia,cambria,&quot;times new roman&quot;,time=
s,serif;letter-spacing:-0.003em;color:rgba(0,0,0,0.8)" class=3D"gmail_msg">=
<br class=3D"gmail_msg"></span></div><div style=3D"font-size:12.8px" class=
=3D"gmail_msg"><span style=3D"font-family:medium-content-serif-font,georgia=
,cambria,&quot;times new roman&quot;,times,serif;letter-spacing:-0.003em;co=
lor:rgba(0,0,0,0.8)" class=3D"gmail_msg">1. Number of pending compactions i=
s greater than=C2=A0</span><em class=3D"m_-171119062601029426m_-53103704347=
40979426m_-4766757875583002751gmail-m_3049142694580412350gmail-markup--em m=
_-171119062601029426m_-5310370434740979426m_-4766757875583002751gmail-m_304=
9142694580412350gmail-markup--li-em gmail_msg" style=3D"font-family:medium-=
content-serif-font,georgia,cambria,&quot;times new roman&quot;,times,serif;=
letter-spacing:-0.003em;color:rgba(0,0,0,0.8);font-feature-settings:&#39;li=
ga&#39; 1,&#39;salt&#39; 1">MAX_PENDING_COMPACTIONS</em><span style=3D"font=
-family:medium-content-serif-font,georgia,cambria,&quot;times new roman&quo=
t;,times,serif;letter-spacing:-0.003em;color:rgba(0,0,0,0.8)" class=3D"gmai=
l_msg">=C2=A0(20 by default)</span></div><div style=3D"font-size:12.8px" cl=
ass=3D"gmail_msg"><span style=3D"font-family:medium-content-serif-font,geor=
gia,cambria,&quot;times new roman&quot;,times,serif;letter-spacing:-0.003em=
;color:rgba(0,0,0,0.8)" class=3D"gmail_msg">2. Node is already running=C2=
=A0<span class=3D"m_-171119062601029426m_-5310370434740979426m_-47667578755=
83002751gmail-il gmail_msg">repair</span>=C2=A0job</span></div><div class=
=3D"gmail_msg"><div class=3D"m_-171119062601029426m_-5310370434740979426h5 =
gmail_msg"><div class=3D"gmail_msg"><span style=3D"font-family:medium-conte=
nt-serif-font,georgia,cambria,&quot;times new roman&quot;,times,serif;lette=
r-spacing:-0.003em;color:rgba(0,0,0,0.8)" class=3D"gmail_msg"><br class=3D"=
gmail_msg"></span></div><div class=3D"gmail_extra gmail_msg"><br class=3D"g=
mail_msg"><div class=3D"gmail_quote gmail_msg">On Tue, Jan 3, 2017 at 11:16=
 AM, Alexander Dejanovski <span dir=3D"ltr" class=3D"gmail_msg">&lt;<a href=
=3D"mailto:alex@thelastpickle.com" class=3D"gmail_msg" target=3D"_blank">al=
ex@thelastpickle.com</a>&gt;</span> wrote:<br class=3D"gmail_msg"><blockquo=
te class=3D"gmail_quote gmail_msg" style=3D"margin:0 0 0 .8ex;border-left:1=
px #ccc solid;padding-left:1ex"><div dir=3D"ltr" class=3D"gmail_msg">Hi Dan=
iel,<div class=3D"gmail_msg"><br class=3D"gmail_msg"></div><div class=3D"gm=
ail_msg">could you file a bug in the issue tracker ?=C2=A0<a href=3D"https:=
//github.com/thelastpickle/cassandra-reaper/issues" class=3D"gmail_msg" tar=
get=3D"_blank">https://github.com/thelastpickle/cassandra-reaper/issues</a>=
=C2=A0</div><div class=3D"gmail_msg"><br class=3D"gmail_msg"></div><div cla=
ss=3D"gmail_msg">We&#39;ll figure out what&#39;s wrong and get your repairs=
 running.</div><div class=3D"gmail_msg"><br class=3D"gmail_msg"></div><div =
class=3D"gmail_msg">Thanks !</div></div><div class=3D"m_-171119062601029426=
m_-5310370434740979426m_-4766757875583002751HOEnZb gmail_msg"><div class=3D=
"m_-171119062601029426m_-5310370434740979426m_-4766757875583002751h5 gmail_=
msg"><br class=3D"gmail_msg"><div class=3D"gmail_quote gmail_msg"><div dir=
=3D"ltr" class=3D"gmail_msg">On Tue, Jan 3, 2017 at 12:35 AM Daniel Klevian=
sky &lt;<a href=3D"mailto:daniel@kleviansky.com" class=3D"gmail_msg" target=
=3D"_blank">daniel@kleviansky.com</a>&gt; wrote:<br class=3D"gmail_msg"></d=
iv><blockquote class=3D"gmail_quote gmail_msg" style=3D"margin:0 0 0 .8ex;b=
order-left:1px #ccc solid;padding-left:1ex"><div dir=3D"ltr" class=3D"m_-17=
1119062601029426m_-5310370434740979426m_-4766757875583002751m_-332679174935=
6756180gmail_msg gmail_msg"><div class=3D"gmail_msg"><div class=3D"gmail_ms=
g"><font face=3D"tahoma, sans-serif" class=3D"m_-171119062601029426m_-53103=
70434740979426m_-4766757875583002751m_-3326791749356756180gmail_msg gmail_m=
sg">Hi everyone,</font></div><div class=3D"gmail_msg"><font face=3D"tahoma,=
 sans-serif" class=3D"m_-171119062601029426m_-5310370434740979426m_-4766757=
875583002751m_-3326791749356756180gmail_msg gmail_msg"><br class=3D"m_-1711=
19062601029426m_-5310370434740979426m_-4766757875583002751m_-33267917493567=
56180gmail_msg gmail_msg"></font></div><div class=3D"gmail_msg"><font face=
=3D"tahoma, sans-serif" class=3D"m_-171119062601029426m_-531037043474097942=
6m_-4766757875583002751m_-3326791749356756180gmail_msg gmail_msg">Using The=
 Last Pickle&#39;s fork of Reaper, and unfortunately running into a bit of =
an issue. I&#39;ll try break it down below.</font></div><div class=3D"gmail=
_msg"><font face=3D"tahoma, sans-serif" class=3D"m_-171119062601029426m_-53=
10370434740979426m_-4766757875583002751m_-3326791749356756180gmail_msg gmai=
l_msg"><br class=3D"m_-171119062601029426m_-5310370434740979426m_-476675787=
5583002751m_-3326791749356756180gmail_msg gmail_msg"></font></div><div clas=
s=3D"gmail_msg"><font face=3D"tahoma, sans-serif" class=3D"m_-1711190626010=
29426m_-5310370434740979426m_-4766757875583002751m_-3326791749356756180gmai=
l_msg gmail_msg"># Problem Description:</font></div><div class=3D"gmail_msg=
"><font face=3D"tahoma, sans-serif" class=3D"m_-171119062601029426m_-531037=
0434740979426m_-4766757875583002751m_-3326791749356756180gmail_msg gmail_ms=
g">* After starting repair via the GUI, progress remains at 0/x.</font></di=
v><div class=3D"gmail_msg"><font face=3D"tahoma, sans-serif" class=3D"m_-17=
1119062601029426m_-5310370434740979426m_-4766757875583002751m_-332679174935=
6756180gmail_msg gmail_msg">* Cassandra nodes calculate their respective to=
ken ranges, and then nothing happens.</font></div><div class=3D"gmail_msg">=
<font face=3D"tahoma, sans-serif" class=3D"m_-171119062601029426m_-53103704=
34740979426m_-4766757875583002751m_-3326791749356756180gmail_msg gmail_msg"=
>* There were no errors in the Reaper or Cassandra logs. Only a message of =
acknowledgement that a repair had initiated.</font></div><div class=3D"gmai=
l_msg"><font face=3D"tahoma, sans-serif" class=3D"m_-171119062601029426m_-5=
310370434740979426m_-4766757875583002751m_-3326791749356756180gmail_msg gma=
il_msg">* Performing stack trace on the running JVM, once can see that the =
thread spawning the repair process was waiting on a lock that was never bei=
ng released.</font></div><div class=3D"gmail_msg"><font face=3D"tahoma, san=
s-serif" class=3D"m_-171119062601029426m_-5310370434740979426m_-47667578755=
83002751m_-3326791749356756180gmail_msg gmail_msg">* This occurred on all n=
odes, and prevented any manually initiated repair process from running. A r=
olling restart of each node was required, after which one could run a `node=
tool repair` successfully.</font></div><div class=3D"gmail_msg"><font face=
=3D"tahoma, sans-serif" class=3D"m_-171119062601029426m_-531037043474097942=
6m_-4766757875583002751m_-3326791749356756180gmail_msg gmail_msg"><br class=
=3D"m_-171119062601029426m_-5310370434740979426m_-4766757875583002751m_-332=
6791749356756180gmail_msg gmail_msg"></font></div><div class=3D"gmail_msg">=
<font face=3D"tahoma, sans-serif" class=3D"m_-171119062601029426m_-53103704=
34740979426m_-4766757875583002751m_-3326791749356756180gmail_msg gmail_msg"=
># Cassandra Cluster Details:</font></div><div class=3D"gmail_msg"><font fa=
ce=3D"tahoma, sans-serif" class=3D"m_-171119062601029426m_-5310370434740979=
426m_-4766757875583002751m_-3326791749356756180gmail_msg gmail_msg">* Cassa=
ndra 2.2.5 running on Windows Server 2008 R2</font></div><div class=3D"gmai=
l_msg"><font face=3D"tahoma, sans-serif" class=3D"m_-171119062601029426m_-5=
310370434740979426m_-4766757875583002751m_-3326791749356756180gmail_msg gma=
il_msg">* 6 node cluster, split across 2 DCs, with RF =3D 3:3.</font></div>=
<div class=3D"gmail_msg"><font face=3D"tahoma, sans-serif" class=3D"m_-1711=
19062601029426m_-5310370434740979426m_-4766757875583002751m_-33267917493567=
56180gmail_msg gmail_msg"><br class=3D"m_-171119062601029426m_-531037043474=
0979426m_-4766757875583002751m_-3326791749356756180gmail_msg gmail_msg"></f=
ont></div><div class=3D"gmail_msg"><font face=3D"tahoma, sans-serif" class=
=3D"m_-171119062601029426m_-5310370434740979426m_-4766757875583002751m_-332=
6791749356756180gmail_msg gmail_msg"># Reaper Details:</font></div><div cla=
ss=3D"gmail_msg"><font face=3D"tahoma, sans-serif" class=3D"m_-171119062601=
029426m_-5310370434740979426m_-4766757875583002751m_-3326791749356756180gma=
il_msg gmail_msg">* Reaper 0.3.3 running on Windows Server 2008 R2, utilisi=
ng a PostgreSQL database.</font></div><div class=3D"gmail_msg"><font face=
=3D"tahoma, sans-serif" class=3D"m_-171119062601029426m_-531037043474097942=
6m_-4766757875583002751m_-3326791749356756180gmail_msg gmail_msg"><br class=
=3D"m_-171119062601029426m_-5310370434740979426m_-4766757875583002751m_-332=
6791749356756180gmail_msg gmail_msg"></font></div><div class=3D"gmail_msg">=
<font face=3D"tahoma, sans-serif" class=3D"m_-171119062601029426m_-53103704=
34740979426m_-4766757875583002751m_-3326791749356756180gmail_msg gmail_msg"=
>## Reaper settings:</font></div><div class=3D"gmail_msg"><font face=3D"tah=
oma, sans-serif" class=3D"m_-171119062601029426m_-5310370434740979426m_-476=
6757875583002751m_-3326791749356756180gmail_msg gmail_msg">* Parallism: DC-=
Aware</font></div><div class=3D"gmail_msg"><font face=3D"tahoma, sans-serif=
" class=3D"m_-171119062601029426m_-5310370434740979426m_-476675787558300275=
1m_-3326791749356756180gmail_msg gmail_msg">* Repair Intensity: 0.9</font><=
/div><div class=3D"gmail_msg"><font face=3D"tahoma, sans-serif" class=3D"m_=
-171119062601029426m_-5310370434740979426m_-4766757875583002751m_-332679174=
9356756180gmail_msg gmail_msg">* Incremental: true</font></div><div class=
=3D"gmail_msg"><font face=3D"tahoma, sans-serif" class=3D"m_-17111906260102=
9426m_-5310370434740979426m_-4766757875583002751m_-3326791749356756180gmail=
_msg gmail_msg"><br class=3D"m_-171119062601029426m_-5310370434740979426m_-=
4766757875583002751m_-3326791749356756180gmail_msg gmail_msg"></font></div>=
<div class=3D"gmail_msg"><font face=3D"tahoma, sans-serif" class=3D"m_-1711=
19062601029426m_-5310370434740979426m_-4766757875583002751m_-33267917493567=
56180gmail_msg gmail_msg">Don&#39;t want to swamp you with more details or =
unnecessary logs, especially as I&#39;d have to sanitize them before sendin=
g them out, so please let me know if there is anything else I can provide, =
and I&#39;ll do my best to get it to you.</font></div></div><div class=3D"m=
_-171119062601029426m_-5310370434740979426m_-4766757875583002751m_-33267917=
49356756180gmail_msg gmail_msg"><br class=3D"m_-171119062601029426m_-531037=
0434740979426m_-4766757875583002751m_-3326791749356756180gmail_msg gmail_ms=
g"></div><div style=3D"font-family:tahoma,sans-serif;display:inline" class=
=3D"gmail_msg">=E2=80=8BKind regards,</div>
<div class=3D"m_-171119062601029426m_-5310370434740979426m_-476675787558300=
2751m_-3326791749356756180gmail_msg gmail_msg"><div style=3D"font-family:ta=
homa,sans-serif;display:inline" class=3D"gmail_msg">Daniel</div></div></div=
>
</blockquote></div></div></div><span class=3D"m_-171119062601029426m_-53103=
70434740979426m_-4766757875583002751HOEnZb gmail_msg"><font color=3D"#88888=
8" class=3D"gmail_msg"><div dir=3D"ltr" class=3D"gmail_msg">-- <br class=3D=
"gmail_msg"></div><div data-smartmail=3D"gmail_signature" class=3D"gmail_ms=
g"><div dir=3D"ltr" class=3D"gmail_msg"><div style=3D"font-family:&quot;hel=
vetica neue&quot;,helvetica,arial,sans-serif;line-height:19.5px" class=3D"g=
mail_msg">-----------------</div><div style=3D"font-family:&quot;helvetica =
neue&quot;,helvetica,arial,sans-serif;line-height:19.5px" class=3D"gmail_ms=
g">Alexander Dejanovski</div><div style=3D"font-family:&quot;helvetica neue=
&quot;,helvetica,arial,sans-serif;line-height:19.5px" class=3D"gmail_msg">F=
rance</div><div style=3D"font-family:&quot;helvetica neue&quot;,helvetica,a=
rial,sans-serif;line-height:19.5px" class=3D"gmail_msg">@alexanderdeja</div=
><div style=3D"font-family:&quot;helvetica neue&quot;,helvetica,arial,sans-=
serif;line-height:19.5px" class=3D"gmail_msg"><br class=3D"gmail_msg"></div=
><div style=3D"font-family:&quot;helvetica neue&quot;,helvetica,arial,sans-=
serif;line-height:19.5px" class=3D"gmail_msg">Consultant</div><div style=3D=
"font-family:&quot;helvetica neue&quot;,helvetica,arial,sans-serif;line-hei=
ght:19.5px" class=3D"gmail_msg">Apache Cassandra Consulting</div><div style=
=3D"font-family:&quot;helvetica neue&quot;,helvetica,arial,sans-serif;line-=
height:19.5px" class=3D"gmail_msg"><a href=3D"http://www.thelastpickle.com/=
" class=3D"gmail_msg" target=3D"_blank">http://www.thelastpickle.com</a></d=
iv></div></div>
</font></span></blockquote></div><br class=3D"gmail_msg"></div></div></div>=
</div>
</blockquote></div><br class=3D"gmail_msg"><br clear=3D"all" class=3D"gmail=
_msg"><div class=3D"gmail_msg"><br class=3D"gmail_msg"></div></div><font co=
lor=3D"#888888" class=3D"gmail_msg">-- <br class=3D"gmail_msg"><div class=
=3D"m_-171119062601029426m_-5310370434740979426gmail_signature gmail_msg" d=
ata-smartmail=3D"gmail_signature"><div dir=3D"ltr" class=3D"gmail_msg"><div=
 class=3D"gmail_msg"><div dir=3D"ltr" class=3D"gmail_msg"><font face=3D"tah=
oma, sans-serif" class=3D"gmail_msg">Daniel Kleviansky</font><div class=3D"=
gmail_msg"><font face=3D"tahoma, sans-serif" class=3D"gmail_msg">System Eng=
ineer &amp; CX Consultant</font></div><div class=3D"gmail_msg"><span style=
=3D"font-family:tahoma,sans-serif;font-size:12.8px" class=3D"gmail_msg">M: =
<a href=3D"tel:+61%20499%20103%20043" value=3D"+61499103043" class=3D"gmail=
_msg" target=3D"_blank">+61 (0) 499 103 043</a> | E: <a href=3D"mailto:dani=
el@kleviansky.com" class=3D"gmail_msg" target=3D"_blank">daniel@kleviansky.=
com</a> | W:=C2=A0</span><span style=3D"font-family:tahoma,sans-serif;font-=
size:12.8px" class=3D"gmail_msg"><a href=3D"http://danielkleviansky.com" cl=
ass=3D"gmail_msg" target=3D"_blank">http://danielkleviansky.com</a></span><=
/div></div></div></div></div>
</font></div></div>
</blockquote></div><br class=3D"gmail_msg"></div></div></blockquote></div><=
div dir=3D"ltr">-- <br></div><div data-smartmail=3D"gmail_signature"><div d=
ir=3D"ltr"><div style=3D"font-family:&quot;helvetica neue&quot;,helvetica,a=
rial,sans-serif;line-height:19.5px">-----------------</div><div style=3D"fo=
nt-family:&quot;helvetica neue&quot;,helvetica,arial,sans-serif;line-height=
:19.5px">Alexander Dejanovski</div><div style=3D"font-family:&quot;helvetic=
a neue&quot;,helvetica,arial,sans-serif;line-height:19.5px">France</div><di=
v style=3D"font-family:&quot;helvetica neue&quot;,helvetica,arial,sans-seri=
f;line-height:19.5px">@alexanderdeja</div><div style=3D"font-family:&quot;h=
elvetica neue&quot;,helvetica,arial,sans-serif;line-height:19.5px"><br></di=
v><div style=3D"font-family:&quot;helvetica neue&quot;,helvetica,arial,sans=
-serif;line-height:19.5px">Consultant</div><div style=3D"font-family:&quot;=
helvetica neue&quot;,helvetica,arial,sans-serif;line-height:19.5px">Apache =
Cassandra Consulting</div><div style=3D"font-family:&quot;helvetica neue&qu=
ot;,helvetica,arial,sans-serif;line-height:19.5px"><a href=3D"http://www.th=
elastpickle.com/" target=3D"_blank">http://www.thelastpickle.com</a></div><=
/div></div>

--001a114dc2a4fa0e90054546d324--