Mailing-List: contact user-help@hadoop.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@hadoop.apache.org
Message-ID: <55B1DC93.6070406@hisilicon.com>
Date: Fri, 24 Jul 2015 14:34:59 +0800
From: Zhudacai <zhudacai@hisilicon.com>
User-Agent: Mozilla/5.0 (Windows NT 6.1;
 rv:24.0) Gecko/20100101 Thunderbird/24.4.0
MIME-Version: 1.0
To: <user@hadoop.apache.org>, <dongbo4@huawei.com>
CC: zhanweitao <zhanweitao@huawei.com>
Subject: Container exited with a non-zero exit code
Content-Type: multipart/alternative;
	boundary="------------090508030702090902000009"

--------------090508030702090902000009
Content-Type: text/plain; charset="GB2312"
Content-Transfer-Encoding: 7bit

Hi.all,

I've just done a fresh install of Hadoop with three nodes, one master (NameNode, SecondNameNode, ResourceTracker) and two slaves (DataNode). The HDFS are successfully formatted, all services are up. When I run the examples, e.g. teragen, terasort, I occasionally got this exception:

/15/07/23 19:55:34 INFO mapreduce.Job: map 0% reduce 0%//
//15/07/23 19:55:40 INFO mapreduce.Job: Task Id : attempt_1437652487249_0001_m_000000_0, Status : FAILED//
//Exception from container-launch.//
//Container id: container_1437652487249_0001_01_000002//
//Exit code: 134//
//Exception message: /bin/bash: line 1: 21736 Aborted //
///usr/openjdk-1.8.0-internal/bin/java -Djava.net.preferIPv4Stack=true -Dhadoop.metrics.log.level=WARN -Xmx200m //
//-Djava.io.tmpdir=/home/hadoop3/tmp/nm-local-dir/usercache/root/appcache/application_1437652487249_0001/container_1437652487249_0001_01_000002/tmp //
//-Dlog4j.configuration=container-log4j.properties //
//-Dyarn.app.container.log.dir=/home/hadoop3/hadoop-2.6.0/logs/userlogs/application_1437652487249_0001/container_1437652487249_0001_01_000002 //
//-Dyarn.app.container.log.filesize=0 //
//-Dhadoop.root.logger=INFO,CLA org.apache.hadoop.mapred.YarnChild 192.168.1.9 39868 attempt_1437652487249_0001_m_000000_0 2 > //
///home/hadoop3/hadoop-2.6.0/logs/userlogs/application_1437652487249_0001/container_1437652487249_0001_01_000002/stdout 2> /home/hadoop3/hadoop-2.6.0/logs/userlogs/application_1437652487249_0001/container_1437652487249_0001_01_000002/stderr//
//
//Stack trace: ExitCodeException exitCode=134: /bin/bash: line 1: 21736 Aborted //
///usr/openjdk-1.8.0-internal/bin/java -Djava.net.preferIPv4Stack=true //
//-Dhadoop.metrics.log.level=WARN -Xmx200m -Djava.io.tmpdir=/home/hadoop3/tmp/nm-local-dir/usercache/root/appcache/application_1437652487249_0001/container_1437652487249_0001_01_000002/tmp //
//-Dlog4j.configuration=container-log4j.properties //
//-Dyarn.app.container.log.dir=/home/hadoop3/hadoop-2.6.0/logs/userlogs/application_1437652487249_0001/container_1437652487249_0001_01_000002 -Dyarn.app.container.log.filesize=0 -Dhadoop.root.logger=INFO,CLA org.apache.hadoop.mapred.YarnChild 192.168.1.9 39868 attempt_1437652487249_0001_m_000000_0 2 > /home/hadoop3/hadoop-2.6.0/logs/userlogs/application_1437652487249_0001/container_1437652487249_0001_01_000002/stdout 2> /home/hadoop3/hadoop-2.6.0/logs/userlogs/application_1437652487249_0001/container_1437652487249_0001_01_000002/stderr//
//
//at org.apache.hadoop.util.Shell.runCommand(Shell.java:538)//
//at org.apache.hadoop.util.Shell.run(Shell.java:455)//
//at org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:715)//
//at org.apache.hadoop.yarn.server.nodemanager.DefaultContainerExecutor.launchContainer(DefaultContainerExecutor.java:211)//
//at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:302)//
//at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:82)//
//at java.util.concurrent.FutureTask.run(FutureTask.java:266)//
//at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)//
//at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)//
//at java.lang.Thread.run(Thread.java:745)//
//
//
//Container exited with a non-zero exit code 134//
//
//15/07/23 19:55:46 INFO mapreduce.Job: map 3% reduce 0%/

But the job could succfully completed.
Here're the configurations:

core-site.xml
/<configuration>//
//<property>//
//<name>fs.defaultFS</name>//
//<value>hdfs://master:9000</value>//
//<final>true</final>//
//</property>//
//<property>//
//<name>hadoop.tmp.dir</name>//
//<value>file:/home/hadoop3/tmp</value>//
//</property>//
//</configuration>//
//
//hdfs-site.xml//
//<configuration>//
//<property>//
//<name>dfs.namenode.secondary.http-address</name>//
//<value>master:50090</value>//
//</property>//
//<property>//
//<name>dfs.namenode.name.dir</name>//
//<value>file:/home/hadoop3/tmp/dfs/name</value>//
//</property>//
//<property>//
//<name>dfs.datanode.data.dir</name>//
//<value>file:/home/hadoop3/tmp/dfs/data</value>//
//</property>//
//<property>//
//<name>dfs.replication</name>//
//<value>1</value>//
//</property>//
//</configuration>//
/
yarn-site.xml
/<configuration>//
//<property>//
//<name>yarn.resourcemanager.hostname</name>//
//<value>master</value>//
//</property>//
//<property>//
//<name>yarn.nodemanager.aux-services</name>//
//<value>mapreduce_shuffle</value>//
//</property>//
//<property>//
//<name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>//
//<value>org.apache.hadoop.mapred.ShuffleHandler</value>//
//</property>//
//<property>//
//<name>yarn.resourcemanager.address</name>//
//<value>master:8032</value>//
//</property>//
//<property>//
//<name>yarn.resourcemanager.scheduler.address</name>//
//<value>master:8030</value>//
//</property>//
//<property>//
//<name>yarn.resourcemanager.resource-tracker.address</name>//
//<value>master:8035</value>//
//</property>//
//<property>//
//<name>yarn.resourcemanager.admin.address</name>//
//<value>master:8033</value>//
//</property>//
//<property>//
//<name>yarn.resourcemanager.webapp.address</name>//
//<value>master:8088</value>//
//</property>//
//<property>//
//<name>yarn.nodemanager.resource.cpu-vcores</name>//
//<value>16</value>//
//</property>//
//</configuration>/

mapred-site.xml
/<configuration>//
//<property>//
//<name>mapreduce.framework.name</name>//
//<value>yarn</value>//
//</property>//
//</configuration>/

I also noticed if hadoop was installed on single node, the exception would never show up.
The number of the exception increases with the values of -Dmapred.map.tasks and -Dmapred.reduce.tasks.

I'm using hadoop 2.6.0, OpenJDK 1.8, runing on the arm64 platform.

Best Regards

Jared


--------------090508030702090902000009
Content-Type: text/html; charset="GB2312"
Content-Transfer-Encoding: 7bit

<html>
  <head>

    <meta http-equiv="content-type" content="text/html; charset=GB2312">
  </head>
  <body text="#000000" bgcolor="#FFFFFF">
    Hi.all,<br>
    <br>
    I've just done a fresh install of Hadoop with three nodes, one
    master (NameNode, SecondNameNode, ResourceTracker) and two slaves
    (DataNode). The HDFS are successfully formatted, all services are
    up. When I run the examples, e.g. teragen, terasort, I occasionally
    got this exception:<br>
    <br>
    <i>15/07/23 19:55:34 INFO mapreduce.Job:&nbsp; map 0% reduce 0%</i><i><br>
    </i><i>15/07/23 19:55:40 INFO mapreduce.Job: Task Id :
      attempt_1437652487249_0001_m_000000_0, Status : FAILED</i><i><br>
    </i><i>Exception from container-launch.</i><i><br>
    </i><i>Container id: container_1437652487249_0001_01_000002</i><i><br>
    </i><i>Exit code: 134</i><i><br>
    </i><i>Exception message: /bin/bash: line 1: 21736
      Aborted&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;</i><i><br>
    </i><i>/usr/openjdk-1.8.0-internal/bin/java
      -Djava.net.preferIPv4Stack=true -Dhadoop.metrics.log.level=WARN
      -Xmx200m </i><i><br>
    </i><i>-Djava.io.tmpdir=/home/hadoop3/tmp/nm-local-dir/usercache/root/appcache/application_1437652487249_0001/container_1437652487249_0001_01_000002/tmp
    </i><i><br>
    </i><i>-Dlog4j.configuration=container-log4j.properties </i><i><br>
    </i><i>-Dyarn.app.container.log.dir=/home/hadoop3/hadoop-2.6.0/logs/userlogs/application_1437652487249_0001/container_1437652487249_0001_01_000002
    </i><i><br>
    </i><i>-Dyarn.app.container.log.filesize=0 </i><i><br>
    </i><i>-Dhadoop.root.logger=INFO,CLA
      org.apache.hadoop.mapred.YarnChild 192.168.1.9 39868
      attempt_1437652487249_0001_m_000000_0 2 &gt; </i><i><br>
    </i><i>/home/hadoop3/hadoop-2.6.0/logs/userlogs/application_1437652487249_0001/container_1437652487249_0001_01_000002/stdout
      2&gt;
/home/hadoop3/hadoop-2.6.0/logs/userlogs/application_1437652487249_0001/container_1437652487249_0001_01_000002/stderr</i><i><br>
    </i><i><br>
    </i><i>Stack trace: ExitCodeException exitCode=134: /bin/bash: line
      1: 21736 Aborted&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;</i><i><br>
    </i><i>/usr/openjdk-1.8.0-internal/bin/java
      -Djava.net.preferIPv4Stack=true </i><i><br>
    </i><i>-Dhadoop.metrics.log.level=WARN -Xmx200m
      -Djava.io.tmpdir=/home/hadoop3/tmp/nm-local-dir/usercache/root/appcache/application_1437652487249_0001/container_1437652487249_0001_01_000002/tmp
    </i><i><br>
    </i><i>-Dlog4j.configuration=container-log4j.properties </i><i><br>
    </i><i>-Dyarn.app.container.log.dir=/home/hadoop3/hadoop-2.6.0/logs/userlogs/application_1437652487249_0001/container_1437652487249_0001_01_000002
      -Dyarn.app.container.log.filesize=0 -Dhadoop.root.logger=INFO,CLA
      org.apache.hadoop.mapred.YarnChild 192.168.1.9 39868
      attempt_1437652487249_0001_m_000000_0 2 &gt;
      /home/hadoop3/hadoop-2.6.0/logs/userlogs/application_1437652487249_0001/container_1437652487249_0001_01_000002/stdout
      2&gt;
/home/hadoop3/hadoop-2.6.0/logs/userlogs/application_1437652487249_0001/container_1437652487249_0001_01_000002/stderr</i><i><br>
    </i><i><br>
    </i><i>&nbsp;&nbsp; &nbsp;at
      org.apache.hadoop.util.Shell.runCommand(Shell.java:538)</i><i><br>
    </i><i>&nbsp;&nbsp; &nbsp;at org.apache.hadoop.util.Shell.run(Shell.java:455)</i><i><br>
    </i><i>&nbsp;&nbsp; &nbsp;at
org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:715)</i><i><br>
    </i><i>&nbsp;&nbsp; &nbsp;at
org.apache.hadoop.yarn.server.nodemanager.DefaultContainerExecutor.launchContainer(DefaultContainerExecutor.java:211)</i><i><br>
    </i><i>&nbsp;&nbsp; &nbsp;at
org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:302)</i><i><br>
    </i><i>&nbsp;&nbsp; &nbsp;at
org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:82)</i><i><br>
    </i><i>&nbsp;&nbsp; &nbsp;at
      java.util.concurrent.FutureTask.run(FutureTask.java:266)</i><i><br>
    </i><i>&nbsp;&nbsp; &nbsp;at
java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)</i><i><br>
    </i><i>&nbsp;&nbsp; &nbsp;at
java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)</i><i><br>
    </i><i>&nbsp;&nbsp; &nbsp;at java.lang.Thread.run(Thread.java:745)</i><i><br>
    </i><i><br>
    </i><i><br>
    </i><i>Container exited with a non-zero exit code 134</i><i><br>
    </i><i><br>
    </i><i>15/07/23 19:55:46 INFO mapreduce.Job:&nbsp; map 3% reduce 0%</i><br>
    <br>
    But the job could succfully completed.<br>
    Here're the configurations:<br>
    <br>
    core-site.xml<br>
    <i>&lt;configuration&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;name&gt;fs.defaultFS&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;value&gt;hdfs://master:9000&lt;/value&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;final&gt;true&lt;/final&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;/property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;name&gt;hadoop.tmp.dir&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;value&gt;<a class="moz-txt-link-freetext" href="file:/home/hadoop3/tmp">file:/home/hadoop3/tmp</a>&lt;/value&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;/property&gt;</i><i><br>
    </i><i>&lt;/configuration&gt;</i><i><br>
    </i><i><br>
    </i><i>hdfs-site.xml</i><i><br>
    </i><i>&lt;configuration&gt;</i><i><br>
    </i><i>&lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp;
      &lt;name&gt;dfs.namenode.secondary.http-address&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;value&gt;master:50090&lt;/value&gt;</i><i><br>
    </i><i>&lt;/property&gt;</i><i><br>
    </i><i>&lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;name&gt;dfs.namenode.name.dir&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp;
      &lt;value&gt;<a class="moz-txt-link-freetext" href="file:/home/hadoop3/tmp/dfs/name">file:/home/hadoop3/tmp/dfs/name</a>&lt;/value&gt;</i><i><br>
    </i><i>&lt;/property&gt;</i><i><br>
    </i><i>&lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;name&gt;dfs.datanode.data.dir&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp;
      &lt;value&gt;<a class="moz-txt-link-freetext" href="file:/home/hadoop3/tmp/dfs/data">file:/home/hadoop3/tmp/dfs/data</a>&lt;/value&gt;</i><i><br>
    </i><i>&lt;/property&gt;</i><i><br>
    </i><i>&lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;name&gt;dfs.replication&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;value&gt;1&lt;/value&gt;</i><i><br>
    </i><i>&lt;/property&gt;</i><i><br>
    </i><i>&lt;/configuration&gt;</i><i><br>
    </i><br>
    yarn-site.xml<br>
    <i>&lt;configuration&gt;</i><i><br>
    </i><i>&nbsp; &lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;name&gt;yarn.resourcemanager.hostname&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;value&gt;master&lt;/value&gt;</i><i><br>
    </i><i>&nbsp; &lt;/property&gt;</i><i><br>
    </i><i>&nbsp; &lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;name&gt;yarn.nodemanager.aux-services&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;value&gt;mapreduce_shuffle&lt;/value&gt;</i><i><br>
    </i><i>&nbsp; &lt;/property&gt;</i><i><br>
    </i><i>&nbsp; &lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;
&lt;name&gt;yarn.nodemanager.aux-services.mapreduce_shuffle.class&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;
      &lt;value&gt;org.apache.hadoop.mapred.ShuffleHandler&lt;/value&gt;</i><i><br>
    </i><i>&nbsp; &lt;/property&gt;</i><i><br>
    </i><i>&nbsp; &lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp; &lt;name&gt;yarn.resourcemanager.address&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp; &lt;value&gt;master:8032&lt;/value&gt;</i><i><br>
    </i><i>&nbsp; &lt;/property&gt;</i><i><br>
    </i><i>&nbsp; &lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;
      &lt;name&gt;yarn.resourcemanager.scheduler.address&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp; &lt;value&gt;master:8030&lt;/value&gt;</i><i><br>
    </i><i>&nbsp; &lt;/property&gt;</i><i><br>
    </i><i>&nbsp; &lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;
      &lt;name&gt;yarn.resourcemanager.resource-tracker.address&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp; &lt;value&gt;master:8035&lt;/value&gt;</i><i><br>
    </i><i>&nbsp; &lt;/property&gt;</i><i><br>
    </i><i>&nbsp; &lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;
      &lt;name&gt;yarn.resourcemanager.admin.address&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp; &lt;value&gt;master:8033&lt;/value&gt;</i><i><br>
    </i><i>&nbsp; &lt;/property&gt;</i><i><br>
    </i><i>&nbsp; &lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;
      &lt;name&gt;yarn.resourcemanager.webapp.address&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp; &lt;value&gt;master:8088&lt;/value&gt;</i><i><br>
    </i><i>&nbsp; &lt;/property&gt;</i><i><br>
    </i><i>&nbsp; &lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;
      &lt;name&gt;yarn.nodemanager.resource.cpu-vcores&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp; &lt;value&gt;16&lt;/value&gt;</i><i><br>
    </i><i>&nbsp; &lt;/property&gt;</i><i><br>
    </i><i>&lt;/configuration&gt;</i><br>
    <br>
    mapred-site.xml<br>
    <i>&lt;configuration&gt;</i><i><br>
    </i><i>&lt;property&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;name&gt;mapreduce.framework.name&lt;/name&gt;</i><i><br>
    </i><i>&nbsp;&nbsp;&nbsp; &lt;value&gt;yarn&lt;/value&gt;</i><i><br>
    </i><i>&lt;/property&gt;</i><i><br>
    </i><i>&lt;/configuration&gt;</i><br>
    <br>
    I also noticed if hadoop was installed on single node, the exception
    would never show up.<br>
    The number of the exception increases with the values of
    -Dmapred.map.tasks and -Dmapred.reduce.tasks.<br>
    <br>
    I'm using hadoop 2.6.0,&nbsp; OpenJDK 1.8, runing on the arm64 platform.<br>
    <br>
    Best Regards<br>
    <br>
    Jared<br>
    <br>
  </body>
</html>

--------------090508030702090902000009--