Mailing-List: contact user-help@cassandra.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@cassandra.apache.org
Received-SPF: pass (nike.apache.org: domain of springrider@gmail.com
 designates 209.85.215.47 as permitted sender)
MIME-Version: 1.0
In-Reply-To: 
 <CAOA66tEwXNnMLy5kUJzFHW7rOTLMgw3WL0v+n-zA_9RjJdaRJQ@mail.gmail.com>
References: 
 <CAOA66tFut5Rrfonk9bb0TEtKMfdSBSY1t_EOuRRSpkMboLCXXA@mail.gmail.com>
 <CAJo5+fkFS=pqmUibwgVXGvGVLm1OnPcT-pqDMusykRppNba=aA@mail.gmail.com>
 <CAOA66tEa4EV0yMP3g1PMRMRsRnvc8=rXKyTujtCfvzFDQ0+AQA@mail.gmail.com>
 <CAOA66tEJjV6rfPiqZDXsU8GKq6F=bt5xBRO-_JcQJpuzeVpuMA@mail.gmail.com>
 <1312132674399-6638649.post@n2.nabble.com>
 <CAOA66tEOSX7rWD-Sc15wsYGfMPt+awFh26u_+X85c=eOsbTWdw@mail.gmail.com>
 <1312153659782-6639317.post@n2.nabble.com>
 <CAOA66tEwXNnMLy5kUJzFHW7rOTLMgw3WL0v+n-zA_9RjJdaRJQ@mail.gmail.com>
From: Yan Chunlu <springrider@gmail.com>
Date: Thu, 4 Aug 2011 16:55:30 +0800
Message-ID: 
 <CAOA66tHnmqy4NUyr5u_PHofdbxD_Lsw6kXmnUHEddLZ513imgA@mail.gmail.com>
Subject: Re: how to solve one node is in heavy load in unbalanced cluster
To: user@cassandra.apache.org
Cc: cassandra-user@incubator.apache.org
Content-Type: multipart/alternative; boundary=0015174c1402c8d3de04a9aa2574

--0015174c1402c8d3de04a9aa2574
Content-Type: text/plain; charset=ISO-8859-1

I have tried the nodetool move but get the following error....

node3:~# nodetool -h node3 move 0
Exception in thread "main" java.lang.IllegalStateException: replication
factor (3) exceeds number of endpoints (2)
 at
org.apache.cassandra.locator.SimpleStrategy.calculateNaturalEndpoints(SimpleStrategy.java:60)
at
org.apache.cassandra.service.StorageService.calculatePendingRanges(StorageService.java:930)
 at
org.apache.cassandra.service.StorageService.calculatePendingRanges(StorageService.java:896)
at
org.apache.cassandra.service.StorageService.startLeaving(StorageService.java:1596)
 at
org.apache.cassandra.service.StorageService.move(StorageService.java:1734)
at
org.apache.cassandra.service.StorageService.move(StorageService.java:1709)
 at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at
sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
 at
sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
at java.lang.reflect.Method.invoke(Method.java:597)
 at
com.sun.jmx.mbeanserver.StandardMBeanIntrospector.invokeM2(StandardMBeanIntrospector.java:93)
at
com.sun.jmx.mbeanserver.StandardMBeanIntrospector.invokeM2(StandardMBeanIntrospector.java:27)
 at
com.sun.jmx.mbeanserver.MBeanIntrospector.invokeM(MBeanIntrospector.java:208)
at com.sun.jmx.mbeanserver.PerInterface.invoke(PerInterface.java:120)
 at com.sun.jmx.mbeanserver.MBeanSupport.invoke(MBeanSupport.java:262)
at
com.sun.jmx.interceptor.DefaultMBeanServerInterceptor.invoke(DefaultMBeanServerInterceptor.java:836)
 at com.sun.jmx.mbeanserver.JmxMBeanServer.invoke(JmxMBeanServer.java:761)
at
javax.management.remote.rmi.RMIConnectionImpl.doOperation(RMIConnectionImpl.java:1427)
 at
javax.management.remote.rmi.RMIConnectionImpl.access$200(RMIConnectionImpl.java:72)
at
javax.management.remote.rmi.RMIConnectionImpl$PrivilegedOperation.run(RMIConnectionImpl.java:1265)
 at
javax.management.remote.rmi.RMIConnectionImpl.doPrivilegedOperation(RMIConnectionImpl.java:1360)
at
javax.management.remote.rmi.RMIConnectionImpl.invoke(RMIConnectionImpl.java:788)
 at sun.reflect.GeneratedMethodAccessor108.invoke(Unknown Source)
at
sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
 at java.lang.reflect.Method.invoke(Method.java:597)
at sun.rmi.server.UnicastServerRef.dispatch(UnicastServerRef.java:305)
 at sun.rmi.transport.Transport$1.run(Transport.java:159)
at java.security.AccessController.doPrivileged(Native Method)
 at sun.rmi.transport.Transport.serviceCall(Transport.java:155)
at sun.rmi.transport.tcp.TCPTransport.handleMessages(TCPTransport.java:535)
 at
sun.rmi.transport.tcp.TCPTransport$ConnectionHandler.run0(TCPTransport.java:790)
at
sun.rmi.transport.tcp.TCPTransport$ConnectionHandler.run(TCPTransport.java:649)
 at
java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886)
at
java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)
 at java.lang.Thread.run(Thread.java:662)


then nodetool shows the node is leaving....


nodetool -h reagon ring
Address         Status State   Load            Owns    Token


 84944475733633104818662955375549269696
node3      Up     Normal  13.18 GB        81.09%
 52773518586096316348543097376923124102
node3     Up     Normal  22.85 GB        10.48%
 70597222385644499881390884416714081360
node3      Up     Leaving 25.44 GB        8.43%
84944475733633104818662955375549269696

the log didn't show any error message neither anything abnormal.  is there
something wrong?


I used to have RF=2, and changed it to RF=3 using cassandra-cli.


On Mon, Aug 1, 2011 at 10:22 AM, Yan Chunlu <springrider@gmail.com> wrote:

> thanks a lot! I will try the "move".
>
>
> On Mon, Aug 1, 2011 at 7:07 AM, mcasandra <mohitanchlia@gmail.com> wrote:
>
>>
>> springrider wrote:
>> >
>> > is that okay to do nodetool move before a completely repair?
>> >
>> > using this equation?
>> > def tokens(nodes):
>> >
>> >    - for x in xrange(nodes):
>> >       - print 2 ** 127 / nodes * x
>> >
>>
>> Yes use that logic to get the tokens. I think it's safe to run move first
>> and reair later. You are moving some nodes data as is so it's no worse
>> than
>> what you have right now.
>>
>> --
>> View this message in context:
>> http://cassandra-user-incubator-apache-org.3065146.n2.nabble.com/how-to-solve-one-node-is-in-heavy-load-in-unbalanced-cluster-tp6630827p6639317.html
>> Sent from the cassandra-user@incubator.apache.org mailing list archive at
>> Nabble.com.
>>
>
>

--0015174c1402c8d3de04a9aa2574
Content-Type: text/html; charset=ISO-8859-1
Content-Transfer-Encoding: quoted-printable

I have tried the nodetool move but get the following error....<div><br></di=
v><div><div>node3:~# nodetool -h node3 move 0</div><div>Exception in thread=
 &quot;main&quot; java.lang.IllegalStateException: replication factor (3) e=
xceeds number of endpoints (2)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at or=
g.apache.cassandra.locator.SimpleStrategy.calculateNaturalEndpoints(SimpleS=
trategy.java:60)</div><div><span class=3D"Apple-tab-span" style=3D"white-sp=
ace:pre">	</span>at org.apache.cassandra.service.StorageService.calculatePe=
ndingRanges(StorageService.java:930)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at or=
g.apache.cassandra.service.StorageService.calculatePendingRanges(StorageSer=
vice.java:896)</div><div><span class=3D"Apple-tab-span" style=3D"white-spac=
e:pre">	</span>at org.apache.cassandra.service.StorageService.startLeaving(=
StorageService.java:1596)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at or=
g.apache.cassandra.service.StorageService.move(StorageService.java:1734)</d=
iv><div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at=
 org.apache.cassandra.service.StorageService.move(StorageService.java:1709)=
</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at su=
n.reflect.NativeMethodAccessorImpl.invoke0(Native Method)</div><div><span c=
lass=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at sun.reflect.Na=
tiveMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at su=
n.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.=
java:25)</div><div><span class=3D"Apple-tab-span" style=3D"white-space:pre"=
>	</span>at java.lang.reflect.Method.invoke(Method.java:597)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at co=
m.sun.jmx.mbeanserver.StandardMBeanIntrospector.invokeM2(StandardMBeanIntro=
spector.java:93)</div><div><span class=3D"Apple-tab-span" style=3D"white-sp=
ace:pre">	</span>at com.sun.jmx.mbeanserver.StandardMBeanIntrospector.invok=
eM2(StandardMBeanIntrospector.java:27)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at co=
m.sun.jmx.mbeanserver.MBeanIntrospector.invokeM(MBeanIntrospector.java:208)=
</div><div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span=
>at com.sun.jmx.mbeanserver.PerInterface.invoke(PerInterface.java:120)</div=
>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at co=
m.sun.jmx.mbeanserver.MBeanSupport.invoke(MBeanSupport.java:262)</div><div>=
<span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at com.sun=
.jmx.interceptor.DefaultMBeanServerInterceptor.invoke(DefaultMBeanServerInt=
erceptor.java:836)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at co=
m.sun.jmx.mbeanserver.JmxMBeanServer.invoke(JmxMBeanServer.java:761)</div><=
div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at jav=
ax.management.remote.rmi.RMIConnectionImpl.doOperation(RMIConnectionImpl.ja=
va:1427)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at ja=
vax.management.remote.rmi.RMIConnectionImpl.access$200(RMIConnectionImpl.ja=
va:72)</div><div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>at javax.management.remote.rmi.RMIConnectionImpl$PrivilegedOperation=
.run(RMIConnectionImpl.java:1265)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at ja=
vax.management.remote.rmi.RMIConnectionImpl.doPrivilegedOperation(RMIConnec=
tionImpl.java:1360)</div><div><span class=3D"Apple-tab-span" style=3D"white=
-space:pre">	</span>at javax.management.remote.rmi.RMIConnectionImpl.invoke=
(RMIConnectionImpl.java:788)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at su=
n.reflect.GeneratedMethodAccessor108.invoke(Unknown Source)</div><div><span=
 class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at sun.reflect.=
DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)</=
div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at ja=
va.lang.reflect.Method.invoke(Method.java:597)</div><div><span class=3D"App=
le-tab-span" style=3D"white-space:pre">	</span>at sun.rmi.server.UnicastSer=
verRef.dispatch(UnicastServerRef.java:305)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at su=
n.rmi.transport.Transport$1.run(Transport.java:159)</div><div><span class=
=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at java.security.Acce=
ssController.doPrivileged(Native Method)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at su=
n.rmi.transport.Transport.serviceCall(Transport.java:155)</div><div><span c=
lass=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at sun.rmi.transp=
ort.tcp.TCPTransport.handleMessages(TCPTransport.java:535)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at su=
n.rmi.transport.tcp.TCPTransport$ConnectionHandler.run0(TCPTransport.java:7=
90)</div><div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</s=
pan>at sun.rmi.transport.tcp.TCPTransport$ConnectionHandler.run(TCPTranspor=
t.java:649)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at ja=
va.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.jav=
a:886)</div><div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExec=
utor.java:908)</div>

<div><span class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>at ja=
va.lang.Thread.run(Thread.java:662)</div><div><br></div><div><br></div><div=
><br></div><div><br></div><div>then nodetool shows the node is leaving....<=
/div>

<div><br></div><div><br></div><div><div>nodetool -h reagon ring</div><div>A=
ddress =A0 =A0 =A0 =A0 Status State =A0 Load =A0 =A0 =A0 =A0 =A0 =A0Owns =
=A0 =A0Token =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =
=A0 =A0 =A0 =A0=A0</div><div>=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A084944475=
733633104818662955375549269696 =A0 =A0 =A0</div>

<div>node3 =A0 =A0 =A0Up =A0 =A0 Normal =A013.18 GB =A0 =A0 =A0 =A081.09% =
=A052773518586096316348543097376923124102 =A0 =A0 =A0</div><div>node3 =A0 =
=A0 Up =A0 =A0 Normal =A022.85 GB =A0 =A0 =A0 =A010.48% =A07059722238564449=
9881390884416714081360 =A0 =A0 =A0</div><div>node3 =A0 =A0 =A0Up =A0 =A0 Le=
aving 25.44 GB =A0 =A0 =A0 =A08.43% =A0 84944475733633104818662955375549269=
696=A0</div>

</div><div><br></div><div>the log didn&#39;t show any error message neither=
 anything abnormal. =A0is there something wrong?</div><div><br></div><div><=
br></div><div>I used to have RF=3D2, and changed it to RF=3D3 using cassand=
ra-cli.</div>

<div><br></div><br><div class=3D"gmail_quote">On Mon, Aug 1, 2011 at 10:22 =
AM, Yan Chunlu <span dir=3D"ltr">&lt;<a href=3D"mailto:springrider@gmail.co=
m">springrider@gmail.com</a>&gt;</span> wrote:<br><blockquote class=3D"gmai=
l_quote" style=3D"margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left=
:1ex;">

thanks a lot! I will try the &quot;move&quot;.<div><div></div><div class=3D=
"h5"><br><br><div class=3D"gmail_quote">On Mon, Aug 1, 2011 at 7:07 AM, mca=
sandra <span dir=3D"ltr">&lt;<a href=3D"mailto:mohitanchlia@gmail.com" targ=
et=3D"_blank">mohitanchlia@gmail.com</a>&gt;</span> wrote:<br>


<blockquote class=3D"gmail_quote" style=3D"margin:0 0 0 .8ex;border-left:1p=
x #ccc solid;padding-left:1ex"><div><br>
springrider wrote:<br>
&gt;<br>
&gt; is that okay to do nodetool move before a completely repair?<br>
&gt;<br>
&gt; using this equation?<br>
&gt; def tokens(nodes):<br>
&gt;<br>
&gt; =A0 =A0- for x in xrange(nodes):<br>
&gt; =A0 =A0 =A0 - print 2 ** 127 / nodes * x<br>
&gt;<br>
<br>
</div>Yes use that logic to get the tokens. I think it&#39;s safe to run mo=
ve first<br>
and reair later. You are moving some nodes data as is so it&#39;s no worse =
than<br>
what you have right now.<br>
<font color=3D"#888888"><br>
--<br>
View this message in context: <a href=3D"http://cassandra-user-incubator-ap=
ache-org.3065146.n2.nabble.com/how-to-solve-one-node-is-in-heavy-load-in-un=
balanced-cluster-tp6630827p6639317.html" target=3D"_blank">http://cassandra=
-user-incubator-apache-org.3065146.n2.nabble.com/how-to-solve-one-node-is-i=
n-heavy-load-in-unbalanced-cluster-tp6630827p6639317.html</a><br>


</font><div><div></div><div>Sent from the <a href=3D"mailto:cassandra-user@=
incubator.apache.org" target=3D"_blank">cassandra-user@incubator.apache.org=
</a> mailing list archive at Nabble.com.<br>
</div></div></blockquote></div><br>
</div></div></blockquote></div><br></div>

--0015174c1402c8d3de04a9aa2574--