Mailing-List: contact user-help@hadoop.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@hadoop.apache.org
Received-SPF: error (athena.apache.org: local policy)
MIME-Version: 1.0
In-Reply-To: 
 <CAHH8OOekcrbF3b3OTOp2VE6LNckk0LdabmeccCPauxrhBrvwWQ@mail.gmail.com>
References: 
 <CAHH8OOeCvT7EN=BnW14jrXSK_D3MPrTDbGExRN+Kk+_=MudSCA@mail.gmail.com>
	<CAAE8jdcNNfwfSSk36p22Kh+ObB3q7rjCqRSrFPUp-qoMh4T5wA@mail.gmail.com>
	<CAHH8OOekcrbF3b3OTOp2VE6LNckk0LdabmeccCPauxrhBrvwWQ@mail.gmail.com>
Date: Sun, 12 May 2013 21:50:29 -0700
Message-ID: 
 <CAAE8jdd14rkGcrfyaec_mTEYmoMPAfYGo3nyO_QANM5yL5vi5w@mail.gmail.com>
Subject: Re: The minimum memory requirements to datanode and namenode?
From: Rishi Yadav <rishi@infoobjects.com>
To: user@hadoop.apache.org
Content-Type: multipart/alternative; boundary=089e013c6a70892bc304dc9241af

--089e013c6a70892bc304dc9241af
Content-Type: text/plain; charset=ISO-8859-1

can you tell specs of node3. Even on a test/demo cluster, anything below 4
GB ram makes the node almost inaccessible as per my experience.


On Sun, May 12, 2013 at 8:25 PM, sam liu <samliuhadoop@gmail.com> wrote:

> Got some exceptions on node3:
> 1. datanode log:
> 2013-04-17 11:13:44,719 INFO
> org.apache.hadoop.hdfs.server.datanode.DataNode: writeBlock
> blk_2478755809192724446_1477 received exception
> java.net.SocketTimeoutException: 63000 millis timeout while waiting for
> channel to be ready for read. ch :
> java.nio.channels.SocketChannel[connected local=/9.50.102.80:58371remote=/
> 9.50.102.79:50010]
> 2013-04-17 11:13:44,721 ERROR
> org.apache.hadoop.hdfs.server.datanode.DataNode: DatanodeRegistration(
> 9.50.102.80:50010,
> storageID=DS-2038715921-9.50.102.80-50010-1366091297051, infoPort=50075,
> ipcPort=50020):DataXceiver
> java.net.SocketTimeoutException: 63000 millis timeout while waiting for
> channel to be ready for read. ch :
> java.nio.channels.SocketChannel[connected local=/9.50.102.80:58371remote=/
> 9.50.102.79:50010]
>         at
> org.apache.hadoop.net.SocketIOWithTimeout.doIO(SocketIOWithTimeout.java:164)
>         at
> org.apache.hadoop.net.SocketInputStream.read(SocketInputStream.java:155)
>         at
> org.apache.hadoop.net.SocketInputStream.read(SocketInputStream.java:128)
>         at
> org.apache.hadoop.net.SocketInputStream.read(SocketInputStream.java:116)
>         at java.io.DataInputStream.readShort(DataInputStream.java:306)
>         at
> org.apache.hadoop.hdfs.server.datanode.DataXceiver.writeBlock(DataXceiver.java:359)
>         at
> org.apache.hadoop.hdfs.server.datanode.DataXceiver.run(DataXceiver.java:112)
>         at java.lang.Thread.run(Thread.java:738)
> 2013-04-17 11:13:44,818 INFO
> org.apache.hadoop.hdfs.server.datanode.DataNode: Receiving block
> blk_8413378381769505032_1477 src: /9.50.102.81:35279 dest: /
> 9.50.102.80:50010
>
>
> 2. tasktracker log:
> 2013-04-23 11:48:26,783 INFO org.apache.hadoop.mapred.UserLogCleaner:
> Deleting user log path job_201304152248_0011
> 2013-04-30 14:48:15,506 ERROR org.apache.hadoop.mapred.TaskTracker: Caught
> exception: java.io.IOException: Call to node1/9.50.102.81:9001 failed on
> local exception: java.io.IOException: Connection reset by peer
>         at org.apache.hadoop.ipc.Client.wrapException(Client.java:1144)
>         at org.apache.hadoop.ipc.Client.call(Client.java:1112)
>         at org.apache.hadoop.ipc.RPC$Invoker.invoke(RPC.java:229)
>         at org.apache.hadoop.mapred.$Proxy2.heartbeat(Unknown Source)
>         at
> org.apache.hadoop.mapred.TaskTracker.transmitHeartBeat(TaskTracker.java:2008)
>         at
> org.apache.hadoop.mapred.TaskTracker.offerService(TaskTracker.java:1802)
>         at org.apache.hadoop.mapred.TaskTracker.run(TaskTracker.java:2654)
>         at org.apache.hadoop.mapred.TaskTracker.main(TaskTracker.java:3909)
> Caused by: java.io.IOException: Connection reset by peer
>         at sun.nio.ch.FileDispatcher.read0(Native Method)
>         at sun.nio.ch.SocketDispatcher.read(SocketDispatcher.java:33)
>         at sun.nio.ch.IOUtil.readIntoNativeBuffer(IOUtil.java:210)
>         at sun.nio.ch.IOUtil.read(IOUtil.java:183)
>         at sun.nio.ch.SocketChannelImpl.read(SocketChannelImpl.java:257)
>         at
> org.apache.hadoop.net.SocketInputStream$Reader.performIO(SocketInputStream.java:55)
>         at
> org.apache.hadoop.net.SocketIOWithTimeout.doIO(SocketIOWithTimeout.java:142)
>         at
> org.apache.hadoop.net.SocketInputStream.read(SocketInputStream.java:155)
>         at
> org.apache.hadoop.net.SocketInputStream.read(SocketInputStream.java:128)
>         at java.io.FilterInputStream.read(FilterInputStream.java:127)
>         at
> org.apache.hadoop.ipc.Client$Connection$PingInputStream.read(Client.java:361)
>         at java.io.BufferedInputStream.fill(BufferedInputStream.java:229)
>         at java.io.BufferedInputStream.read(BufferedInputStream.java:248)
>         at java.io.DataInputStream.readInt(DataInputStream.java:381)
>         at
> org.apache.hadoop.ipc.Client$Connection.receiveResponse(Client.java:841)
>         at org.apache.hadoop.ipc.Client$Connection.run(Client.java:786)
>
> 2013-04-30 14:48:15,517 INFO org.apache.hadoop.mapred.TaskTracker:
> Resending 'status' to 'node1' with reponseId '-12904
> 2013-04-30 14:48:16,404 INFO org.apache.hadoop.mapred.TaskTracker:
> SHUTDOWN_MSG:
>
>
>
> 2013/5/13 Rishi Yadav <rishi@infoobjects.com>
>
>> do you get any error when trying to connect to cluster, something like
>> 'tried n times' or replicated 0 times.
>>
>>
>>
>>
>> On Sun, May 12, 2013 at 7:28 PM, sam liu <samliuhadoop@gmail.com> wrote:
>>
>>> Hi,
>>>
>>> I setup a cluster with 3 nodes, and after that I did not submit any job
>>> on it. But, after few days, I found the cluster is unhealthy:
>>> - No result returned after issuing command 'hadoop dfs -ls /' or 'hadoop
>>> dfsadmin -report' for a while
>>> - The page of 'http://namenode:50070' could not be opened as expected...
>>> - ...
>>>
>>> I did not find any usefull info in the logs, but found the avaible
>>> memory of the cluster nodes are very low at that time:
>>> - node1(NN,JT,DN,TT): 158 mb mem is available
>>> - node2(DN,TT): 75 mb mem is available
>>> - node3(DN,TT): 174 mb mem is available
>>>
>>> I guess the issue of my cluster is caused by lacking of memeory, and my
>>> questions are:
>>> - Without running jobs, what's the minimum memory requirements to
>>> datanode and namenode?
>>> - How to define the minimum memeory for datanode and namenode?
>>>
>>> Thanks!
>>>
>>> Sam Liu
>>>
>>
>>
>

--089e013c6a70892bc304dc9241af
Content-Type: text/html; charset=ISO-8859-1
Content-Transfer-Encoding: quoted-printable

<div dir=3D"ltr">can you tell specs of node3. Even on a test/demo cluster, =
anything below 4 GB ram makes the node almost inaccessible as per my experi=
ence.<div class=3D"gmail_extra"><div><p><br></p></div><br><div class=3D"gma=
il_quote">
On Sun, May 12, 2013 at 8:25 PM, sam liu <span dir=3D"ltr">&lt;<a href=3D"m=
ailto:samliuhadoop@gmail.com" target=3D"_blank">samliuhadoop@gmail.com</a>&=
gt;</span> wrote:<br><blockquote class=3D"gmail_quote" style=3D"margin:0 0 =
0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div dir=3D"ltr"><div><div>Got some exceptions on node3:<br></div>1. datano=
de log:<br>2013-04-17 11:13:44,719 INFO org.apache.hadoop.hdfs.server.datan=
ode.DataNode: writeBlock blk_2478755809192724446_1477 received exception ja=
va.net.SocketTimeoutException: 63000 millis timeout while waiting for chann=
el to be ready for read. ch : java.nio.channels.SocketChannel[connected loc=
al=3D/<a href=3D"http://9.50.102.80:58371" target=3D"_blank">9.50.102.80:58=
371</a> remote=3D/<a href=3D"http://9.50.102.79:50010" target=3D"_blank">9.=
50.102.79:50010</a>]<br>

2013-04-17 11:13:44,721 ERROR org.apache.hadoop.hdfs.server.datanode.DataNo=
de: DatanodeRegistration(<a href=3D"http://9.50.102.80:50010" target=3D"_bl=
ank">9.50.102.80:50010</a>, storageID=3DDS-2038715921-9.50.102.80-50010-136=
6091297051, infoPort=3D50075, ipcPort=3D50020):DataXceiver<br>

java.net.SocketTimeoutException: 63000 millis timeout while waiting for cha=
nnel to be ready for read. ch : java.nio.channels.SocketChannel[connected l=
ocal=3D/<a href=3D"http://9.50.102.80:58371" target=3D"_blank">9.50.102.80:=
58371</a> remote=3D/<a href=3D"http://9.50.102.79:50010" target=3D"_blank">=
9.50.102.79:50010</a>]<br>

=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.net.SocketIOWithTimeout.doIO(Soc=
ketIOWithTimeout.java:164)<br>=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.ne=
t.SocketInputStream.read(SocketInputStream.java:155)<br>=A0=A0=A0=A0=A0=A0=
=A0 at org.apache.hadoop.net.SocketInputStream.read(SocketInputStream.java:=
128)<br>

=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.net.SocketInputStream.read(Socke=
tInputStream.java:116)<br>=A0=A0=A0=A0=A0=A0=A0 at java.io.DataInputStream.=
readShort(DataInputStream.java:306)<br>=A0=A0=A0=A0=A0=A0=A0 at org.apache.=
hadoop.hdfs.server.datanode.DataXceiver.writeBlock(DataXceiver.java:359)<br=
>

=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.hdfs.server.datanode.DataXceiver=
.run(DataXceiver.java:112)<br>=A0=A0=A0=A0=A0=A0=A0 at java.lang.Thread.run=
(Thread.java:738)<br>2013-04-17 11:13:44,818 INFO org.apache.hadoop.hdfs.se=
rver.datanode.DataNode: Receiving block blk_8413378381769505032_1477 src: /=
<a href=3D"http://9.50.102.81:35279" target=3D"_blank">9.50.102.81:35279</a=
> dest: /<a href=3D"http://9.50.102.80:50010" target=3D"_blank">9.50.102.80=
:50010</a><br>

<br><br></div>2. tasktracker log:<br>2013-04-23 11:48:26,783 INFO org.apach=
e.hadoop.mapred.UserLogCleaner: Deleting user log path job_201304152248_001=
1<br>2013-04-30 14:48:15,506 ERROR org.apache.hadoop.mapred.TaskTracker: Ca=
ught exception: java.io.IOException: Call to node1/<a href=3D"http://9.50.1=
02.81:9001" target=3D"_blank">9.50.102.81:9001</a> failed on local exceptio=
n: java.io.IOException: Connection reset by peer<br>

=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.ipc.Client.wrapException(Client.=
java:1144)<br>=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.ipc.Client.call(Cl=
ient.java:1112)<br>=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.ipc.RPC$Invok=
er.invoke(RPC.java:229)<br>=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.mapre=
d.$Proxy2.heartbeat(Unknown Source)<br>

=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.mapred.TaskTracker.transmitHeart=
Beat(TaskTracker.java:2008)<br>=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.m=
apred.TaskTracker.offerService(TaskTracker.java:1802)<br>=A0=A0=A0=A0=A0=A0=
=A0 at org.apache.hadoop.mapred.TaskTracker.run(TaskTracker.java:2654)<br>

=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.mapred.TaskTracker.main(TaskTrac=
ker.java:3909)<br>Caused by: java.io.IOException: Connection reset by peer<=
br>=A0=A0=A0=A0=A0=A0=A0 at sun.nio.ch.FileDispatcher.read0(Native Method)<=
br>=A0=A0=A0=A0=A0=A0=A0 at sun.nio.ch.SocketDispatcher.read(SocketDispatch=
er.java:33)<br>

=A0=A0=A0=A0=A0=A0=A0 at sun.nio.ch.IOUtil.readIntoNativeBuffer(IOUtil.java=
:210)<br>=A0=A0=A0=A0=A0=A0=A0 at sun.nio.ch.IOUtil.read(IOUtil.java:183)<b=
r>=A0=A0=A0=A0=A0=A0=A0 at sun.nio.ch.SocketChannelImpl.read(SocketChannelI=
mpl.java:257)<br>=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.net.SocketInput=
Stream$Reader.performIO(SocketInputStream.java:55)<br>

=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.net.SocketIOWithTimeout.doIO(Soc=
ketIOWithTimeout.java:142)<br>=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.ne=
t.SocketInputStream.read(SocketInputStream.java:155)<br>=A0=A0=A0=A0=A0=A0=
=A0 at org.apache.hadoop.net.SocketInputStream.read(SocketInputStream.java:=
128)<br>

=A0=A0=A0=A0=A0=A0=A0 at java.io.FilterInputStream.read(FilterInputStream.j=
ava:127)<br>=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.ipc.Client$Connectio=
n$PingInputStream.read(Client.java:361)<br>=A0=A0=A0=A0=A0=A0=A0 at java.io=
.BufferedInputStream.fill(BufferedInputStream.java:229)<br>

=A0=A0=A0=A0=A0=A0=A0 at java.io.BufferedInputStream.read(BufferedInputStre=
am.java:248)<br>=A0=A0=A0=A0=A0=A0=A0 at java.io.DataInputStream.readInt(Da=
taInputStream.java:381)<br>=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.ipc.C=
lient$Connection.receiveResponse(Client.java:841)<br>

=A0=A0=A0=A0=A0=A0=A0 at org.apache.hadoop.ipc.Client$Connection.run(Client=
.java:786)<br><br>2013-04-30 14:48:15,517 INFO org.apache.hadoop.mapred.Tas=
kTracker: Resending &#39;status&#39; to &#39;node1&#39; with reponseId &#39=
;-12904<br>

2013-04-30 14:48:16,404 INFO org.apache.hadoop.mapred.TaskTracker: SHUTDOWN=
_MSG:<br><br></div><div class=3D"HOEnZb"><div class=3D"h5"><div class=3D"gm=
ail_extra"><br><br><div class=3D"gmail_quote">2013/5/13 Rishi Yadav <span d=
ir=3D"ltr">&lt;<a href=3D"mailto:rishi@infoobjects.com" target=3D"_blank">r=
ishi@infoobjects.com</a>&gt;</span><br>

<blockquote class=3D"gmail_quote" style=3D"margin:0 0 0 .8ex;border-left:1p=
x #ccc solid;padding-left:1ex"><div dir=3D"ltr">do you get any error when t=
rying to connect to cluster, something like &#39;tried n times&#39; or repl=
icated 0 times.<div>

<div><div class=3D"gmail_extra"><div><p><br></p><p></p></div>
<br><br><div class=3D"gmail_quote">On Sun, May 12, 2013 at 7:28 PM, sam liu=
 <span dir=3D"ltr">&lt;<a href=3D"mailto:samliuhadoop@gmail.com" target=3D"=
_blank">samliuhadoop@gmail.com</a>&gt;</span> wrote:<br><blockquote class=
=3D"gmail_quote" style=3D"margin:0 0 0 .8ex;border-left:1px #ccc solid;padd=
ing-left:1ex">


<div dir=3D"ltr"><div><div><div><div><div><div><div><div><div><div><div>Hi,=
<br><br></div>I setup a cluster with 3 nodes, and after that I did not subm=
it any job on it. But, after few days, I found the cluster is unhealthy:<br=
>


</div>- No result returned after issuing command &#39;hadoop dfs -ls /&#39;=
 or &#39;hadoop dfsadmin -report&#39; for a while<br></div>- The page of &#=
39;<a href=3D"http://namenode:50070" target=3D"_blank">http://namenode:5007=
0</a>&#39; could not be opened as expected...<br>


- ...<br><br></div>I did not find any usefull info in the logs, but found t=
he avaible memory of the cluster nodes are very low at that time:<br></div>=
- node1(NN,JT,DN,TT): 158 mb mem is available<br></div>- node2(DN,TT): 75 m=
b mem is available</div>


- node3(DN,TT): 174 mb mem is available<br><br></div>I guess the issue of m=
y cluster is caused by lacking of memeory, and my questions are:<br></div>-=
 Without running jobs, what&#39;s the minimum memory requirements to datano=
de and namenode? <br>


- How to define the minimum memeory for datanode and namenode?<br><br></div=
>Thanks!<span><font color=3D"#888888"><br><br></font></span></div><span><fo=
nt color=3D"#888888">Sam Liu<br></font></span></div>

</blockquote></div><br></div></div></div></div>
</blockquote></div><br></div>
</div></div></blockquote></div><br></div></div>

--089e013c6a70892bc304dc9241af--