Mailing-List: contact user-help@hadoop.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@hadoop.apache.org
Received-SPF: pass (athena.apache.org: domain of e.v.skaley@gmail.com
 designates 209.85.217.176 as permitted sender)
Message-ID: <50978264.5070104@gmail.com>
Date: Mon, 05 Nov 2012 10:09:56 +0100
From: Eduard Skaley <e.v.skaley@gmail.com>
User-Agent: Mozilla/5.0 (X11; Linux x86_64;
 rv:16.0) Gecko/20121028 Thunderbird/16.0.2
MIME-Version: 1.0
To: user@hadoop.apache.org
CC: Nitin Pawar <nitinpawar432@gmail.com>
Subject: Re: Error:
 org.apache.hadoop.mapreduce.task.reduce.Shuffle$ShuffleError
 Java Heap Space
References: <50914788.2000005@gmail.com>
 <CAORpBsipCB26GWK8tZ+FGMbGwy1Rzy-fwG=WgHQMBZBsdqJ9BQ@mail.gmail.com>
 <50914A96.1070405@gmail.com>
In-Reply-To: <50914A96.1070405@gmail.com>
Content-Type: multipart/alternative;
 boundary="------------030908080000070502000309"

This is a multi-part message in MIME format.
--------------030908080000070502000309
Content-Type: text/plain; charset=ISO-8859-1; format=flowed
Content-Transfer-Encoding: 7bit

By the way it happens on Yarn not on MRv1
> each container gets 1GB at the moment.
>> can you try increasing memory per reducer  ?
>>
>>
>> On Wed, Oct 31, 2012 at 9:15 PM, Eduard Skaley <e.v.skaley@gmail.com 
>> <mailto:e.v.skaley@gmail.com>> wrote:
>>
>>     Hello,
>>
>>     I'm getting this Error through job execution:
>>
>>     16:20:26 INFO  [main]                     Job -  map 100% reduce 46%
>>     16:20:27 INFO  [main]                     Job -  map 100% reduce 51%
>>     16:20:29 INFO  [main]                     Job -  map 100% reduce 62%
>>     16:20:30 INFO  [main]                     Job -  map 100% reduce 64%
>>     16:20:32 INFO  [main]                     Job - Task Id :
>>     attempt_1351680008718_0018_r_000006_0, Status : FAILED
>>     Error:
>>     org.apache.hadoop.mapreduce.task.reduce.Shuffle$ShuffleError:
>>     error in shuffle in fetcher#2
>>         at
>>     org.apache.hadoop.mapreduce.task.reduce.Shuffle.run(Shuffle.java:123)
>>         at org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:371)
>>         at org.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:152)
>>         at java.security.AccessController.doPrivileged(Native Method)
>>         at javax.security.auth.Subject.doAs(Subject.java:396)
>>         at
>>     org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1332)
>>         at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:147)
>>     Caused by: java.lang.OutOfMemoryError: Java heap space
>>         at
>>     org.apache.hadoop.io.BoundedByteArrayOutputStream.<init>(BoundedByteArrayOutputStream.java:58)
>>         at
>>     org.apache.hadoop.io.BoundedByteArrayOutputStream.<init>(BoundedByteArrayOutputStream.java:45)
>>         at
>>     org.apache.hadoop.mapreduce.task.reduce.MapOutput.<init>(MapOutput.java:97)
>>         at
>>     org.apache.hadoop.mapreduce.task.reduce.MergeManager.unconditionalReserve(MergeManager.java:286)
>>         at
>>     org.apache.hadoop.mapreduce.task.reduce.MergeManager.reserve(MergeManager.java:276)
>>         at
>>     org.apache.hadoop.mapreduce.task.reduce.Fetcher.copyMapOutput(Fetcher.java:384)
>>         at
>>     org.apache.hadoop.mapreduce.task.reduce.Fetcher.copyFromHost(Fetcher.java:319)
>>         at
>>     org.apache.hadoop.mapreduce.task.reduce.Fetcher.run(Fetcher.java:179)
>>
>>     16:20:33 INFO  [main]                     Job -  map 100% reduce 65%
>>     16:20:36 INFO  [main]                     Job -  map 100% reduce 67%
>>     16:20:39 INFO  [main]                     Job -  map 100% reduce 69%
>>     16:20:41 INFO  [main]                     Job -  map 100% reduce 70%
>>     16:20:43 INFO  [main]                     Job -  map 100% reduce 71%
>>
>>     I have no clue what the issue could be for this. I googled this
>>     issue and checked several sources of possible solutions but
>>     nothing does fit.
>>
>>     I saw this jira entry which could fit:
>>     https://issues.apache.org/jira/browse/MAPREDUCE-4655.
>>
>>     Here somebody recommends to increase the value for the property
>>     dfs.datanode.max.xcievers / dfs.datanode.max.receiver.threads to
>>     4096, but this is the value for our cluster.
>>     http://yaseminavcular.blogspot.de/2011/04/common-hadoop-hdfs-exceptions-with.html
>>
>>     The issue with the to small input files doesn't fit I think,
>>     because the map phase reads 137 files with each 130MB. Block Size
>>     is 128MB.
>>
>>     The cluster uses version 2.0.0-cdh4.1.1,
>>     581959ba23e4af85afd8db98b7687662fe9c5f20.
>>
>>     Thx
>>
>>
>>
>>
>>
>>
>>
>>
>>
>> -- 
>> Nitin Pawar
>>
>


--------------030908080000070502000309
Content-Type: text/html; charset=ISO-8859-1
Content-Transfer-Encoding: 7bit

<html>
  <head>
    <meta content="text/html; charset=ISO-8859-1"
      http-equiv="Content-Type">
  </head>
  <body text="#000000" bgcolor="#FFFFFF">
    <div class="moz-cite-prefix">By the way it happens on Yarn not on
      MRv1<br>
    </div>
    <blockquote cite="mid:50914A96.1070405@gmail.com" type="cite">
      <meta content="text/html; charset=ISO-8859-1"
        http-equiv="Content-Type">
      <div class="moz-cite-prefix">each container gets 1GB at the
        moment.<br>
      </div>
      <blockquote
cite="mid:CAORpBsipCB26GWK8tZ+FGMbGwy1Rzy-fwG=WgHQMBZBsdqJ9BQ@mail.gmail.com"
        type="cite">can you try increasing memory per reducer &nbsp;?&nbsp;
        <div class="gmail_extra"><br>
          <br>
          <div class="gmail_quote">On Wed, Oct 31, 2012 at 9:15 PM,
            Eduard Skaley <span dir="ltr">&lt;<a moz-do-not-send="true"
                href="mailto:e.v.skaley@gmail.com" target="_blank">e.v.skaley@gmail.com</a>&gt;</span>
            wrote:<br>
            <blockquote class="gmail_quote" style="margin:0 0 0
              .8ex;border-left:1px #ccc solid;padding-left:1ex">
              <div text="#000000" bgcolor="#FFFFFF"> Hello,<br>
                <br>
                I'm getting this Error through job execution:<br>
                <br>
                16:20:26 INFO&nbsp; [main]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job -&nbsp; map
                100% reduce 46%<br>
                16:20:27 INFO&nbsp; [main]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job -&nbsp; map
                100% reduce 51%<br>
                16:20:29 INFO&nbsp; [main]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job -&nbsp; map
                100% reduce 62%<br>
                16:20:30 INFO&nbsp; [main]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job -&nbsp; map
                100% reduce 64%<br>
                16:20:32 INFO&nbsp; [main]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job - Task Id
                : attempt_1351680008718_0018_r_000006_0, Status : FAILED<br>
                Error:
                org.apache.hadoop.mapreduce.task.reduce.Shuffle$ShuffleError:
                error in shuffle in fetcher#2<br>
                &nbsp;&nbsp;&nbsp; at
                org.apache.hadoop.mapreduce.task.reduce.Shuffle.run(Shuffle.java:123)<br>
                &nbsp;&nbsp;&nbsp; at
                org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:371)<br>
                &nbsp;&nbsp;&nbsp; at
                org.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:152)<br>
                &nbsp;&nbsp;&nbsp; at
                java.security.AccessController.doPrivileged(Native
                Method)<br>
                &nbsp;&nbsp;&nbsp; at
                javax.security.auth.Subject.doAs(Subject.java:396)<br>
                &nbsp;&nbsp;&nbsp; at
org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1332)<br>
                &nbsp;&nbsp;&nbsp; at
                org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:147)<br>
                Caused by: java.lang.OutOfMemoryError: Java heap space<br>
                &nbsp;&nbsp;&nbsp; at
org.apache.hadoop.io.BoundedByteArrayOutputStream.&lt;init&gt;(BoundedByteArrayOutputStream.java:58)<br>
                &nbsp;&nbsp;&nbsp; at
org.apache.hadoop.io.BoundedByteArrayOutputStream.&lt;init&gt;(BoundedByteArrayOutputStream.java:45)<br>
                &nbsp;&nbsp;&nbsp; at
org.apache.hadoop.mapreduce.task.reduce.MapOutput.&lt;init&gt;(MapOutput.java:97)<br>
                &nbsp;&nbsp;&nbsp; at
org.apache.hadoop.mapreduce.task.reduce.MergeManager.unconditionalReserve(MergeManager.java:286)<br>
                &nbsp;&nbsp;&nbsp; at
org.apache.hadoop.mapreduce.task.reduce.MergeManager.reserve(MergeManager.java:276)<br>
                &nbsp;&nbsp;&nbsp; at
org.apache.hadoop.mapreduce.task.reduce.Fetcher.copyMapOutput(Fetcher.java:384)<br>
                &nbsp;&nbsp;&nbsp; at
org.apache.hadoop.mapreduce.task.reduce.Fetcher.copyFromHost(Fetcher.java:319)<br>
                &nbsp;&nbsp;&nbsp; at
                org.apache.hadoop.mapreduce.task.reduce.Fetcher.run(Fetcher.java:179)<br>
                <br>
                16:20:33 INFO&nbsp; [main]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job -&nbsp; map
                100% reduce 65%<br>
                16:20:36 INFO&nbsp; [main]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job -&nbsp; map
                100% reduce 67%<br>
                16:20:39 INFO&nbsp; [main]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job -&nbsp; map
                100% reduce 69%<br>
                16:20:41 INFO&nbsp; [main]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job -&nbsp; map
                100% reduce 70%<br>
                16:20:43 INFO&nbsp; [main]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Job -&nbsp; map
                100% reduce 71%<br>
                <br>
                I have no clue what the issue could be for this. I
                googled this issue and checked several sources of
                possible solutions but nothing does fit.<br>
                <br>
                I saw this jira entry which could fit: <a
                  moz-do-not-send="true"
                  href="https://issues.apache.org/jira/browse/MAPREDUCE-4655"
                  target="_blank">https://issues.apache.org/jira/browse/MAPREDUCE-4655</a>.<br>
                <br>
                Here somebody recommends to increase the value for the
                property <span>dfs.datanode.max.xcievers / </span> <span
style="text-indent:0px;letter-spacing:normal;font-variant:normal;text-align:-webkit-auto;font-style:normal;display:inline!important;font-weight:normal;float:none;line-height:17px;text-transform:none;font-size:13px;white-space:normal;font-family:Arial,FreeSans,Helvetica,sans-serif;word-spacing:0px">dfs.datanode.max.receiver.threads


                  to 4096, but this is the value for our cluster.<br>
                </span><span
style="text-indent:0px;letter-spacing:normal;font-variant:normal;text-align:-webkit-auto;font-style:normal;display:inline!important;font-weight:normal;float:none;line-height:17px;text-transform:none;font-size:13px;white-space:normal;font-family:Arial,FreeSans,Helvetica,sans-serif;word-spacing:0px">
                  <a moz-do-not-send="true"
href="http://yaseminavcular.blogspot.de/2011/04/common-hadoop-hdfs-exceptions-with.html"
                    target="_blank">http://yaseminavcular.blogspot.de/2011/04/common-hadoop-hdfs-exceptions-with.html</a><br>
                  <br>
                  The issue with the to small input files doesn't fit I
                  think, because the map phase reads 137 files with each
                  130MB. Block Size is 128MB.<br>
                  <br>
                  The cluster uses version </span><span
style="text-indent:0px;letter-spacing:normal;font-variant:normal;text-align:-webkit-auto;font-style:normal;display:inline!important;font-weight:normal;float:none;line-height:17px;text-transform:none;font-size:13px;white-space:normal;font-family:Arial,FreeSans,Helvetica,sans-serif;word-spacing:0px"><span
style="text-indent:0px;letter-spacing:normal;font-variant:normal;text-align:-webkit-auto;font-style:normal;display:inline!important;font-weight:normal;float:none;line-height:normal;text-transform:none;font-size:medium;white-space:pre-wrap;font-family:sans-serif;word-spacing:0px">2.0.0-cdh4.1.1,


                    581959ba23e4af85afd8db98b7687662fe9c5f20</span>.<br>
                  <br>
                  Thx<br>
                  <br>
                  <br>
                </span><br>
                <br>
                <br>
                <br>
              </div>
            </blockquote>
          </div>
          <br>
          <br clear="all">
          <div><br>
          </div>
          -- <br>
          Nitin Pawar<br>
          <br>
        </div>
      </blockquote>
      <br>
    </blockquote>
    <br>
  </body>
</html>

--------------030908080000070502000309--