Mailing-List: contact user-help@hadoop.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@hadoop.apache.org
From: "Naganarasimha G R (Naga)" <garlanaganarasimha@huawei.com>
To: "user@hadoop.apache.org" <user@hadoop.apache.org>
Subject: RE: Why would ApplicationManager request RAM more that defaut 1GB?
Thread-Topic: Why would ApplicationManager request RAM more that defaut 1GB?
Thread-Index: 
 AQHQ9Ux9oxOfFfnxjUqWNXpNRgwJCJ5JfI6f//+36gCAAjq4gIAA27cAgAAJZgCAAB13AIAE7/SJ
Date: Mon, 28 Sep 2015 04:31:21 +0000
Message-ID: 
 <AD354F56741A1B47882A625909A59C692BE321BE@SZXEML505-MBX.china.huawei.com>
References: <180B059C-338E-4C79-9C16-DB8588730223@cleverdata.ru>
 <AD354F56741A1B47882A625909A59C692BE312E4@SZXEML505-MBX.china.huawei.com>
 <8CA5CDF9-DCFA-47B3-8626-4A5244C21918@cleverdata.ru>
 <CAHNHubYXuRJKYgdbPCowedwcnxs9hPzxQr+N9Gbum4TX_r3S3w@mail.gmail.com>
 <A684D160-AD29-474A-B5F9-BD51FDABB1D0@cleverdata.ru>
 <CAAntRU+UnpSDGvcDBVFzkjy043fTEFcTCOKNW9d+LijWjotNyg@mail.gmail.com>,<2CFBE63C-288B-44D9-8B73-AE25E88879B9@cleverdata.ru>
In-Reply-To: <2CFBE63C-288B-44D9-8B73-AE25E88879B9@cleverdata.ru>
Accept-Language: en-US
Content-Language: en-US
Content-Type: multipart/alternative;
	boundary="_000_AD354F56741A1B47882A625909A59C692BE321BESZXEML505MBXchi_"
MIME-Version: 1.0

--_000_AD354F56741A1B47882A625909A59C692BE321BESZXEML505MBXchi_
Content-Type: text/plain; charset="windows-1251"
Content-Transfer-Encoding: quoted-printable

Hi Ilya,
I think that property is of less significance, its only to confirm wrt beha=
vior wrt virtual memory. But the imp one is, can we get the snapshot of the=
 heap (using the command shared earlier),
from it roughly we can determine which object is hogging the memory.

+ Naga


________________________________
From: Ilya Karpov [i.karpov@cleverdata.ru]
Sent: Friday, September 25, 2015 14:34
To: user@hadoop.apache.org
Subject: Re: Why would ApplicationManager request RAM more that defaut 1GB?

Hi Manoj & Naga,
I=92m surprised but there is no such a property in CHD conf files (greped a=
ll *.xml in OSes where yarn lives!)
I think that this property is set by Cloudera: http://image.slidesharecdn.c=
om/yarnsaboutyarn-kathleenting112114-141125155911-conversion-gate01/95/yarn=
s-about-yarn-28-638.jpg?cb=3D1416931543
(we use chd 5.4.5)

25 =F1=E5=ED=F2. 2015 =E3., =E2 10:19, Naganarasimha Garla <naganarasimha.g=
r@gmail.com<mailto:naganarasimha.gr@gmail.com>> =ED=E0=EF=E8=F1=E0=EB(=E0):

Hi Manoj & Ilya,

>From the logs
2015-09-21 22:50:34,018 WARN org.apache.hadoop.yarn.server.nodemanager.cont=
ainermanager.monitor.ContainersMonitorImpl: Container [pid=3D13982,containe=
rID=3Dcontainer_1442402147223_0165_01_000001] is running beyond physical me=
mory limits.

This indicates that its increase in Physical memory limits and not virtual =
limits due to which container was killed and also probability that Containe=
r Monitor  would  wait till vmem is 3.4 GB when limit is 2.1 GB to kill it =
is less.

Vmem includes overall memory limits including the files opened etc ... but =
seems like virtual mem check in your setup seems to be disabled. please che=
ck for configuration as mentioned by Manoj "yarn.nodemanager.vmem-check-ena=
bled "  to cross verify


On Fri, Sep 25, 2015 at 12:15 PM, Ilya Karpov <i.karpov@cleverdata.ru<mailt=
o:i.karpov@cleverdata.ru>> wrote:
Hello, Manoj
the actual question is why this happens

24 =F1=E5=ED=F2. 2015 =E3., =E2 20:39, manoj <manojm.321@gmail.com<mailto:m=
anojm.321@gmail.com>> =ED=E0=EF=E8=F1=E0=EB(=E0):

Hello IIya,

Looks like the Vmem usage is going above the above 2.1 of Pmem times thats =
why the container is getting killed,

1.0 GB of 1 GB physical memory used; 3.4 GB of 2.1 GB virtual memory used

By default Vmem is set to 2.1 times of the Pmem.
Looks like your job is taking 3.4GB!

You can change the ratio by setting in Yarn-site.xml:
yarn.nodemanager.vmem-pmem-ratio

You can optionally disable this check by setting following to false:

yarn.nodemanager.vmem-check-enabled


Thanks,
-Manoj

On Wed, Sep 23, 2015 at 12:36 AM, Ilya Karpov <i.karpov@cleverdata.ru<mailt=
o:i.karpov@cleverdata.ru>> wrote:
Great thanks for your reply!

>1. Which version of Hadoop/ YARN ?
Hadoop(command: hadoop version):
Hadoop 2.6.0-cdh5.4.5
Subversion http://github.com/cloudera/hadoop -r ab14c89fe25e9fb3f9de4fb852c=
21365b7c5608b
Compiled by jenkins on 2015-08-12T21:11Z
Compiled with protoc 2.5.0
>From source with checksum d31cb7e46b8602edaf68d335b785ab
This command was run using /opt/cloudera/parcels/CDH-5.4.5-1.cdh5.4.5.p0.7/=
jars/hadoop-common-2.6.0-cdh5.4.5.jar
Yarn (command: yarn version) prints exactly the same.

>2. From the logs is it getting killed due to over usage of Vmem or Physica=
l memory ?
Because of over usage of Physical memory. Last seconds of life:
2015-09-21 22:50:34,017 INFO org.apache.hadoop.yarn.server.nodemanager.cont=
ainermanager.monitor.ContainersMonitorImpl: Memory usage of ProcessTree 139=
82 for container-id container_1442402147223_0165_01_000001: 1.0 GB of 1 GB =
physical memory used; 3.4 GB of 2.1 GB virtual memory used
2015-09-21 22:50:34,017 WARN org.apache.hadoop.yarn.server.nodemanager.cont=
ainermanager.monitor.ContainersMonitorImpl: Process tree for container: con=
tainer_1442402147223_0165_01_000001 has processes older than 1 iteration ru=
nning over the configured limit. Limit=3D1073741824, current usage =3D 1074=
352128
2015-09-21 22:50:34,018 WARN org.apache.hadoop.yarn.server.nodemanager.cont=
ainermanager.monitor.ContainersMonitorImpl: Container [pid=3D13982,containe=
rID=3Dcontainer_1442402147223_0165_01_000001] is running beyond physical me=
mory limits. Current usage: 1.0 GB of 1 GB physical memory used; 3.4 GB of =
2.1 GB virtual memory used. Killing container.
Dump of the process-tree for container_1442402147223_0165_01_000001 :
        |- PID PPID PGRPID SESSID CMD_NAME USER_MODE_TIME(MILLIS) SYSTEM_TI=
ME(MILLIS) VMEM_USAGE(BYTES) RSSMEM_USAGE(PAGES) FULL_CMD_LINE
        |- 13994 13982 13982 13982 (java) 4285 714 3602911232 261607 /opt/j=
dk1.8.0_60/bin/java -Dlog4j.configuration=3Dcontainer-log4j.properties -Dya=
rn.app.container.log.dir=3D/var/log/hadoop-yarn/contai
ner/application_1442402147223_0165/container_1442402147223_0165_01_000001 -=
Dyarn.app.container.log.filesize=3D0 -Dhadoop.root.logger=3DINFO,CLA -Djava=
.net.preferIPv4Stack=3Dtrue -Xmx825955249 org.apache.had
oop.mapreduce.v2.app.MRAppMaster
        |- 13982 13980 13982 13982 (bash) 0 0 14020608 686 /bin/bash -c /op=
t/jdk1.8.0_60/bin/java -Dlog4j.configuration=3Dcontainer-log4j.properties -=
Dyarn.app.container.log.dir=3D/var/log/hadoop-yarn/container/application_14=
42402147223_0165/container_1442402147223_0165_01_000001 -Dyarn.app.containe=
r.log.filesize=3D0 -Dhadoop.root.logger=3DINFO,CLA  -Djava.net.preferIPv4St=
ack=3Dtrue -Xmx825955249 org.apache.hadoop.mapreduce.v2.app.MRAppMaster 1>/=
var/log/hadoop-yarn/container/application_1442402147223_0165/container_1442=
402147223_0165_01_000001/stdout 2>/var/log/hadoop-yarn/container/applicatio=
n_1442402147223_0165/container_1442402147223_0165_01_000001/stderr

2015-09-21 22:50:34,018 INFO org.apache.hadoop.yarn.server.nodemanager.cont=
ainermanager.monitor.ContainersMonitorImpl: Removed ProcessTree with root 1=
3982
2015-09-21 22:50:34,025 INFO org.apache.hadoop.yarn.server.nodemanager.cont=
ainermanager.container.Container: Container container_1442402147223_0165_01=
_000001 transitioned from RUNNING to KILLING
2015-09-21 22:50:34,025 INFO org.apache.hadoop.yarn.server.nodemanager.cont=
ainermanager.launcher.ContainerLaunch: Cleaning up container container_1442=
402147223_0165_01_000001
2015-09-21 22:50:34,075 WARN org.apache.hadoop.yarn.server.nodemanager.Defa=
ultContainerExecutor: Exit code from container container_1442402147223_0165=
_01_000001 is : 143

>3. Can you run " jmap -histo -F <PID of AM container>" and share the heap =
dump result?
I=92ll try to do it asap.

>4. If possible can you pastebin the AM logs?
yes, https://drive.google.com/file/d/0B1DPTV7TbcO0cEEwSDZyUnBWUEk/view?usp=
=3Dsharing


> 23 =F1=E5=ED=F2. 2015 =E3., =E2 7:21, Naganarasimha G R (Naga) <garlanaga=
narasimha@huawei.com<mailto:garlanaganarasimha@huawei.com>> =ED=E0=EF=E8=F1=
=E0=EB(=E0):
>
> Hi Ilya,
>    In a normal case AM memory requirement should not be more than the def=
ault for small sized jobs, but seems to be something erroneous in your case=
, Would like to have more information :
> 1. Which version of Hadoop/ YARN ?
> 2. From the logs is it getting killed due to over usage of Vmem or Physic=
al memory ?
> 3. Can you run " jmap -histo -F <PID of AM container>" and share the heap=
 dump result?
> 4. If possible can you pastebin the AM logs?
>
> + Naga
> ________________________________________
> From: Ilya Karpov [i.karpov@cleverdata.ru<mailto:i.karpov@cleverdata.ru>]
> Sent: Tuesday, September 22, 2015 21:06
> To: user@hadoop.apache.org<mailto:user@hadoop.apache.org>
> Subject: Why would ApplicationManager request RAM more that defaut 1GB?
>
> Hi all,
> can=92t figure out subj.
> On my hadoop cluster I have an issue when ApplicationMaster(AM) killed by=
 NodeManager because AM tries to allocate more than default 1GB. MR applica=
tion, that AM is in charge of, is a mapper only job(1(!) mapper, no reducer=
s, downloads data from remote source). At the moment when AM killed, MR job=
 is ok (uses about 70% of ram limit). MR job doesn't have any custom counte=
rs, distributes caches etc, just downloads data (by portions) via custom in=
put format. To fix this issue, I raised memory limit for AM, but I want to =
know what is the reason of eating 1GB (!) for a trivial job like mine?
>


--
--Manoj Kumar M


--_000_AD354F56741A1B47882A625909A59C692BE321BESZXEML505MBXchi_
Content-Type: text/html; charset="windows-1251"
Content-Transfer-Encoding: quoted-printable

<html dir=3D"ltr">
<head>
<meta http-equiv=3D"Content-Type" content=3D"text/html; charset=3Dwindows-1=
251">
<style type=3D"text/css" id=3D"owaParaStyle"></style>
</head>
<body class=3D"" style=3D"word-wrap:break-word" fpstyle=3D"1" ocsi=3D"0">
<div style=3D"direction: ltr;font-family: Tahoma;color: #000000;font-size: =
10pt;">Hi Ilya,
<div><span class=3D"Apple-tab-span" style=3D"white-space:pre"></span>I thin=
k that property is of less significance, its only to confirm wrt behavior w=
rt virtual memory. But the imp one is, can we get the snapshot of the heap =
(using the command shared earlier),&nbsp;</div>
<div>from it roughly we can determine which object is hogging the memory.</=
div>
<div><br>
</div>
<div><span style=3D"font-size: 10pt;">&#43; Naga</span></div>
<div><br>
</div>
<div><br>
<div style=3D"font-family: Times New Roman; color: #000000; font-size: 16px=
">
<hr tabindex=3D"-1">
<div id=3D"divRpF403115" style=3D"direction: ltr;"><font face=3D"Tahoma" si=
ze=3D"2" color=3D"#000000"><b>From:</b> Ilya Karpov [i.karpov@cleverdata.ru=
]<br>
<b>Sent:</b> Friday, September 25, 2015 14:34<br>
<b>To:</b> user@hadoop.apache.org<br>
<b>Subject:</b> Re: Why would ApplicationManager request RAM more that defa=
ut 1GB?<br>
</font><br>
</div>
<div></div>
<div>Hi Manoj &amp; Naga,
<div class=3D"">I=92m surprised but there is no such a property in CHD conf=
 files (greped all *.xml in OSes where yarn lives!)</div>
<div class=3D"">I think that this property is set by Cloudera:&nbsp;<a href=
=3D"http://image.slidesharecdn.com/yarnsaboutyarn-kathleenting112114-141125=
155911-conversion-gate01/95/yarns-about-yarn-28-638.jpg?cb=3D1416931543" cl=
ass=3D"" target=3D"_blank">http://image.slidesharecdn.com/yarnsaboutyarn-ka=
thleenting112114-141125155911-conversion-gate01/95/yarns-about-yarn-28-638.=
jpg?cb=3D1416931543</a></div>
<div class=3D"">(we use chd 5.4.5)</div>
<div class=3D""><br class=3D"">
<div class=3D"">
<div>
<blockquote type=3D"cite" class=3D"">
<div class=3D"">25 =F1=E5=ED=F2. 2015 =E3., =E2 10:19, Naganarasimha Garla =
&lt;<a href=3D"mailto:naganarasimha.gr@gmail.com" class=3D"" target=3D"_bla=
nk">naganarasimha.gr@gmail.com</a>&gt; =ED=E0=EF=E8=F1=E0=EB(=E0):</div>
<br class=3D"Apple-interchange-newline">
<div class=3D"">
<div dir=3D"ltr" class=3D"">Hi Manoj &amp; Ilya,
<div class=3D""><br class=3D"">
</div>
<div class=3D"">From the logs&nbsp;</div>
<blockquote class=3D"gmail_quote" style=3D"margin:0px 0px 0px 0.8ex; border=
-left-width:1px; border-left-color:rgb(204,204,204); border-left-style:soli=
d; padding-left:1ex">
<span class=3D"" style=3D"font-size:12.8px">2015-09-21 22:50:34,018 WARN or=
g.apache.hadoop.yarn.server.</span><span class=3D"" style=3D"font-size:12.8=
px">nodemanager.containermanager.</span><span class=3D"" style=3D"font-size=
:12.8px">monitor.ContainersMonitorImpl: Container
 [pid=3D13982,containerID=3D</span><b class=3D""><span class=3D"" style=3D"=
font-size:12.8px">container_1442402147223_0165_</span></b><span class=3D"" =
style=3D"font-size:12.8px"><b class=3D"">01_000001</b>] is running beyond
<b class=3D""><u class=3D"">physical</u></b> memory limits.&nbsp;</span></b=
lockquote>
<div class=3D""><br class=3D"">
</div>
<div class=3D"">This indicates that its increase in Physical memory limits =
and not virtual limits due to which container was killed and also probabili=
ty that Container Monitor&nbsp;<span class=3D"" style=3D"font-size:12.8px">=
&nbsp;would &nbsp;wait till vmem is&nbsp;</span><span class=3D"" style=3D"f=
ont-size:12.8px">3.4
 GB when limit is 2.1 GB to kill it is less.</span></div>
<div class=3D""><span class=3D"" style=3D"font-size:12.8px"><br class=3D"">
</span></div>
<div class=3D""><span class=3D"" style=3D"font-size:12.8px">Vmem includes o=
verall memory limits including the files opened etc ... but seems like virt=
ual mem check in your setup seems to be disabled. please check for configur=
ation as mentioned by Manoj &quot;</span><a name=3D"1500070c2c02aab8_yarn.n=
odemanager.vmem-check-enabled" class=3D"" style=3D"font-size:12.8px; font-f=
amily:Times">yarn.nodemanager.vmem-check-enabled
 &quot; &nbsp;to cross verify</a></div>
<div class=3D""><span class=3D"" style=3D"font-size:12.8px"><br class=3D"">
</span></div>
</div>
<div class=3D"gmail_extra"><br class=3D"">
<div class=3D"gmail_quote">On Fri, Sep 25, 2015 at 12:15 PM, Ilya Karpov <s=
pan dir=3D"ltr" class=3D"">
&lt;<a href=3D"mailto:i.karpov@cleverdata.ru" class=3D"" target=3D"_blank">=
i.karpov@cleverdata.ru</a>&gt;</span> wrote:<br class=3D"">
<blockquote class=3D"gmail_quote" style=3D"margin:0 0 0 .8ex; border-left:1=
px #ccc solid; padding-left:1ex">
<div class=3D"" style=3D"word-wrap:break-word">
<div class=3D"">Hello, Manoj</div>
<div class=3D"">the actual question is why this happens</div>
<br class=3D"">
<div class=3D"">
<blockquote type=3D"cite" class=3D"">
<div class=3D"">24 =F1=E5=ED=F2. 2015 =E3., =E2 20:39, manoj &lt;<a href=3D=
"mailto:manojm.321@gmail.com" class=3D"" target=3D"_blank">manojm.321@gmail=
.com</a>&gt; =ED=E0=EF=E8=F1=E0=EB(=E0):</div>
<div class=3D"">
<div class=3D"h5"><br class=3D"">
<div class=3D"">
<div dir=3D"ltr" class=3D"">Hello IIya,
<div class=3D""><br class=3D"">
</div>
<div class=3D"">Looks like the Vmem usage is going above the above 2.1 of P=
mem times thats why the container is getting killed,</div>
<div class=3D""><br class=3D"">
</div>
<blockquote class=3D"gmail_quote" style=3D"margin:0px 0px 0px 0.8ex; border=
-left-width:1px; border-left-color:rgb(204,204,204); border-left-style:soli=
d; padding-left:1ex">
<span class=3D"" style=3D"font-size:13px">1.0 GB of 1 GB physical memory us=
ed; <b class=3D"">
3.4 GB of 2.1 GB virtual memory used</b></span></blockquote>
<div class=3D""><br class=3D"">
</div>
<div class=3D"">By default Vmem is set to 2.1 times of the Pmem.</div>
<div class=3D"">Looks like your job is taking 3.4GB!</div>
<div class=3D""><br class=3D"">
</div>
<div class=3D"">You can change the ratio by setting in Yarn-site.xml:</div>
<div class=3D""><a name=3D"150034064c0bed1d_yarn.nodemanager.vmem-pmem-rati=
o" class=3D"" style=3D"font-family:Times">yarn.nodemanager.vmem-pmem-ratio&=
nbsp;</a><br class=3D"">
</div>
<div class=3D""><a name=3D"150034064c0bed1d_yarn.nodemanager.vmem-pmem-rati=
o" class=3D"" style=3D"font-family:Times"><br class=3D"">
</a></div>
<div class=3D"">You can optionally disable this check by setting following =
to false:</div>
<div class=3D""><br class=3D"">
</div>
<div class=3D""><a name=3D"150034064c0bed1d_yarn.nodemanager.vmem-check-ena=
bled" class=3D"" style=3D"font-family:Times">yarn.nodemanager.vmem-check-en=
abled&nbsp;</a><br class=3D"">
</div>
<div class=3D""><a name=3D"150034064c0bed1d_yarn.nodemanager.vmem-pmem-rati=
o" class=3D"" style=3D"font-family:Times"><br class=3D"">
</a></div>
<div class=3D""><a name=3D"150034064c0bed1d_yarn.nodemanager.vmem-pmem-rati=
o" class=3D"" style=3D"font-family:Times"><br class=3D"">
</a></div>
<div class=3D"">Thanks,</div>
<div class=3D"">-Manoj</div>
</div>
<div class=3D"gmail_extra"><br class=3D"">
<div class=3D"gmail_quote">On Wed, Sep 23, 2015 at 12:36 AM, Ilya Karpov <s=
pan dir=3D"ltr" class=3D"">
&lt;<a href=3D"mailto:i.karpov@cleverdata.ru" class=3D"" target=3D"_blank">=
i.karpov@cleverdata.ru</a>&gt;</span> wrote:<br class=3D"">
<blockquote class=3D"gmail_quote" style=3D"margin:0 0 0 .8ex; border-left:1=
px #ccc solid; padding-left:1ex">
Great thanks for your reply!<br class=3D"">
<span class=3D""><br class=3D"">
&gt;1. Which version of Hadoop/ YARN ?<br class=3D"">
</span>Hadoop(command: hadoop version):<br class=3D"">
Hadoop 2.6.0-cdh5.4.5<br class=3D"">
Subversion <a href=3D"http://github.com/cloudera/hadoop" rel=3D"noreferrer"=
 class=3D"" target=3D"_blank">
http://github.com/cloudera/hadoop</a> -r ab14c89fe25e9fb3f9de4fb852c21365b7=
c5608b<br class=3D"">
Compiled by jenkins on 2015-08-12T21:11Z<br class=3D"">
Compiled with protoc 2.5.0<br class=3D"">
>From source with checksum d31cb7e46b8602edaf68d335b785ab<br class=3D"">
This command was run using /opt/cloudera/parcels/CDH-5.4.5-1.cdh5.4.5.p0.7/=
jars/hadoop-common-2.6.0-cdh5.4.5.jar<br class=3D"">
Yarn (command: yarn version) prints exactly the same.<br class=3D"">
<span class=3D""><br class=3D"">
&gt;2. From the logs is it getting killed due to over usage of Vmem or Phys=
ical memory ?<br class=3D"">
</span>Because of over usage of Physical memory. Last seconds of life:<br c=
lass=3D"">
2015-09-21 22:50:34,017 INFO org.apache.hadoop.yarn.server.nodemanager.cont=
ainermanager.monitor.ContainersMonitorImpl: Memory usage of ProcessTree 139=
82 for container-id container_1442402147223_0165_01_000001: 1.0 GB of 1 GB =
physical memory used; 3.4 GB of
 2.1 GB virtual memory used<br class=3D"">
2015-09-21 22:50:34,017 WARN org.apache.hadoop.yarn.server.nodemanager.cont=
ainermanager.monitor.ContainersMonitorImpl: Process tree for container: con=
tainer_1442402147223_0165_01_000001 has processes older than 1 iteration ru=
nning over the configured limit.
 Limit=3D1073741824, current usage =3D 1074352128<br class=3D"">
2015-09-21 22:50:34,018 WARN org.apache.hadoop.yarn.server.nodemanager.cont=
ainermanager.monitor.ContainersMonitorImpl: Container [pid=3D13982,containe=
rID=3Dcontainer_1442402147223_0165_01_000001] is running beyond physical me=
mory limits. Current usage: 1.0 GB of
 1 GB physical memory used; 3.4 GB of 2.1 GB virtual memory used. Killing c=
ontainer.<br class=3D"">
Dump of the process-tree for container_1442402147223_0165_01_000001 :<br cl=
ass=3D"">
&nbsp; &nbsp; &nbsp; &nbsp; |- PID PPID PGRPID SESSID CMD_NAME USER_MODE_TI=
ME(MILLIS) SYSTEM_TIME(MILLIS) VMEM_USAGE(BYTES) RSSMEM_USAGE(PAGES) FULL_C=
MD_LINE<br class=3D"">
&nbsp; &nbsp; &nbsp; &nbsp; |- 13994 13982 13982 13982 (java) 4285 714 3602=
911232 261607 /opt/jdk1.8.0_60/bin/java -Dlog4j.configuration=3Dcontainer-l=
og4j.properties -Dyarn.app.container.log.dir=3D/var/log/hadoop-yarn/contai<=
br class=3D"">
ner/application_1442402147223_0165/container_1442402147223_0165_01_000001 -=
Dyarn.app.container.log.filesize=3D0 -Dhadoop.root.logger=3DINFO,CLA -Djava=
.net.preferIPv4Stack=3Dtrue -Xmx825955249 org.apache.had<br class=3D"">
oop.mapreduce.v2.app.MRAppMaster<br class=3D"">
&nbsp; &nbsp; &nbsp; &nbsp; |- 13982 13980 13982 13982 (bash) 0 0 14020608 =
686 /bin/bash -c /opt/jdk1.8.0_60/bin/java -Dlog4j.configuration=3Dcontaine=
r-log4j.properties -Dyarn.app.container.log.dir=3D/var/log/hadoop-yarn/cont=
ainer/application_1442402147223_0165/container_1442402147223_0165_01_000001
 -Dyarn.app.container.log.filesize=3D0 -Dhadoop.root.logger=3DINFO,CLA&nbsp=
; -Djava.net.preferIPv4Stack=3Dtrue -Xmx825955249 org.apache.hadoop.mapredu=
ce.v2.app.MRAppMaster 1&gt;/var/log/hadoop-yarn/container/application_14424=
02147223_0165/container_1442402147223_0165_01_000001/stdout
 2&gt;/var/log/hadoop-yarn/container/application_1442402147223_0165/contain=
er_1442402147223_0165_01_000001/stderr<br class=3D"">
<br class=3D"">
2015-09-21 22:50:34,018 INFO org.apache.hadoop.yarn.server.nodemanager.cont=
ainermanager.monitor.ContainersMonitorImpl: Removed ProcessTree with root 1=
3982<br class=3D"">
2015-09-21 22:50:34,025 INFO org.apache.hadoop.yarn.server.nodemanager.cont=
ainermanager.container.Container: Container container_1442402147223_0165_01=
_000001 transitioned from RUNNING to KILLING<br class=3D"">
2015-09-21 22:50:34,025 INFO org.apache.hadoop.yarn.server.nodemanager.cont=
ainermanager.launcher.ContainerLaunch: Cleaning up container container_1442=
402147223_0165_01_000001<br class=3D"">
2015-09-21 22:50:34,075 WARN org.apache.hadoop.yarn.server.nodemanager.Defa=
ultContainerExecutor: Exit code from container container_1442402147223_0165=
_01_000001 is : 143<br class=3D"">
<span class=3D""><br class=3D"">
&gt;3. Can you run &quot; jmap -histo -F &lt;PID of AM container&gt;&quot; =
and share the heap dump result?<br class=3D"">
</span>I=92ll try to do it asap.<br class=3D"">
<span class=3D""><br class=3D"">
&gt;4. If possible can you pastebin the AM logs?<br class=3D"">
</span>yes, <a href=3D"https://drive.google.com/file/d/0B1DPTV7TbcO0cEEwSDZ=
yUnBWUEk/view?usp=3Dsharing" rel=3D"noreferrer" class=3D"" target=3D"_blank=
">
https://drive.google.com/file/d/0B1DPTV7TbcO0cEEwSDZyUnBWUEk/view?usp=3Dsha=
ring</a><br class=3D"">
<br class=3D"">
<br class=3D"">
<br class=3D"">
<br class=3D"">
&gt; 23 =F1=E5=ED=F2. 2015 =E3., =E2 7:21, Naganarasimha G R (Naga) &lt;<a =
href=3D"mailto:garlanaganarasimha@huawei.com" class=3D"" target=3D"_blank">=
garlanaganarasimha@huawei.com</a>&gt; =ED=E0=EF=E8=F1=E0=EB(=E0):<br class=
=3D"">
<div class=3D"">
<div class=3D"">&gt;<br class=3D"">
&gt; Hi Ilya,<br class=3D"">
&gt;&nbsp; &nbsp; In a normal case AM memory requirement should not be more=
 than the default for small sized jobs, but seems to be something erroneous=
 in your case, Would like to have more information :<br class=3D"">
&gt; 1. Which version of Hadoop/ YARN ?<br class=3D"">
&gt; 2. From the logs is it getting killed due to over usage of Vmem or Phy=
sical memory ?<br class=3D"">
&gt; 3. Can you run &quot; jmap -histo -F &lt;PID of AM container&gt;&quot;=
 and share the heap dump result?<br class=3D"">
&gt; 4. If possible can you pastebin the AM logs?<br class=3D"">
&gt;<br class=3D"">
&gt; &#43; Naga<br class=3D"">
&gt; ________________________________________<br class=3D"">
&gt; From: Ilya Karpov [<a href=3D"mailto:i.karpov@cleverdata.ru" class=3D"=
" target=3D"_blank">i.karpov@cleverdata.ru</a>]<br class=3D"">
&gt; Sent: Tuesday, September 22, 2015 21:06<br class=3D"">
&gt; To: <a href=3D"mailto:user@hadoop.apache.org" class=3D"" target=3D"_bl=
ank">user@hadoop.apache.org</a><br class=3D"">
&gt; Subject: Why would ApplicationManager request RAM more that defaut 1GB=
?<br class=3D"">
&gt;<br class=3D"">
&gt; Hi all,<br class=3D"">
&gt; can=92t figure out subj.<br class=3D"">
&gt; On my hadoop cluster I have an issue when ApplicationMaster(AM) killed=
 by NodeManager because AM tries to allocate more than default 1GB. MR appl=
ication, that AM is in charge of, is a mapper only job(1(!) mapper, no redu=
cers, downloads data from remote source).
 At the moment when AM killed, MR job is ok (uses about 70% of ram limit). =
MR job doesn't have any custom counters, distributes caches etc, just downl=
oads data (by portions) via custom input format. To fix this issue, I raise=
d memory limit for AM, but I want
 to know what is the reason of eating 1GB (!) for a trivial job like mine?<=
br class=3D"">
&gt;<br class=3D"">
<br class=3D"">
</div>
</div>
</blockquote>
</div>
<br class=3D"">
<br clear=3D"all" class=3D"">
<div class=3D""><br class=3D"">
</div>
-- <br class=3D"">
<div class=3D"">
<div dir=3D"ltr" class=3D"">--Manoj Kumar M</div>
</div>
</div>
</div>
</div>
</div>
</blockquote>
</div>
<br class=3D"">
</div>
</blockquote>
</div>
<br class=3D"">
</div>
</div>
</blockquote>
</div>
<br class=3D"">
</div>
</div>
</div>
</div>
</div>
</div>
</body>
</html>

--_000_AD354F56741A1B47882A625909A59C692BE321BESZXEML505MBXchi_--