Return-Path: Delivered-To: apmail-hadoop-mapreduce-user-archive@minotaur.apache.org Received: (qmail 34963 invoked from network); 22 Mar 2011 17:45:38 -0000 Received: from hermes.apache.org (HELO mail.apache.org) (140.211.11.3) by minotaur.apache.org with SMTP; 22 Mar 2011 17:45:38 -0000 Received: (qmail 99494 invoked by uid 500); 22 Mar 2011 17:45:37 -0000 Delivered-To: apmail-hadoop-mapreduce-user-archive@hadoop.apache.org Received: (qmail 99434 invoked by uid 500); 22 Mar 2011 17:45:36 -0000 Mailing-List: contact mapreduce-user-help@hadoop.apache.org; run by ezmlm Precedence: bulk List-Help: List-Unsubscribe: List-Post: List-Id: Reply-To: mapreduce-user@hadoop.apache.org Delivered-To: mailing list mapreduce-user@hadoop.apache.org Received: (qmail 99426 invoked by uid 99); 22 Mar 2011 17:45:36 -0000 Received: from nike.apache.org (HELO nike.apache.org) (192.87.106.230) by apache.org (qpsmtpd/0.29) with ESMTP; Tue, 22 Mar 2011 17:45:36 +0000 X-ASF-Spam-Status: No, hits=1.5 required=5.0 tests=HTML_MESSAGE,RCVD_IN_DNSWL_LOW,SPF_PASS X-Spam-Check-By: apache.org Received-SPF: pass (nike.apache.org: domain of yuval@ooyala.com designates 209.85.218.48 as permitted sender) Received: from [209.85.218.48] (HELO mail-yi0-f48.google.com) (209.85.218.48) by apache.org (qpsmtpd/0.29) with ESMTP; Tue, 22 Mar 2011 17:45:29 +0000 Received: by yia25 with SMTP id 25so3902217yia.35 for ; Tue, 22 Mar 2011 10:45:08 -0700 (PDT) MIME-Version: 1.0 Received: by 10.236.201.136 with SMTP id b8mr7508146yho.121.1300815908344; Tue, 22 Mar 2011 10:45:08 -0700 (PDT) Received: by 10.147.169.7 with HTTP; Tue, 22 Mar 2011 10:45:08 -0700 (PDT) Date: Tue, 22 Mar 2011 10:45:08 -0700 Message-ID: Subject: "job.split" file not found From: Yuval Oren To: mapreduce-user@hadoop.apache.org Content-Type: multipart/alternative; boundary=20cf3040ead0229459049f15ceaf X-Virus-Checked: Checked by ClamAV on apache.org --20cf3040ead0229459049f15ceaf Content-Type: text/plain; charset=ISO-8859-1 Hello all, I'm having trouble getting a large mapping job to complete. Several of thousands of mappers are failing with this error: java.io.FileNotFoundException: File does not exist: /data/hadoop/cache/mapred/mapred/staging/yuval/.staging/job_201011120027_144772/job.split at org.apache.hadoop.hdfs.DFSClient$DFSInputStream.openInfo(DFSClient.java:1586) at org.apache.hadoop.hdfs.DFSClient$DFSInputStream.(DFSClient.java:1577) at org.apache.hadoop.hdfs.DFSClient.open(DFSClient.java:428) at org.apache.hadoop.hdfs.DistributedFileSystem.open(DistributedFileSystem.java:185) at org.apache.hadoop.fs.FileSystem.open(FileSystem.java:431) at org.apache.hadoop.mapred.MapTask.getSplitDetails(MapTask.java:325) at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:357) at org.apache.hadoop.mapred.MapTask.run(MapTask.java:317) at org.apache.hadoop.mapred.Child$4.run(Child.java:217) at java.security.AccessController.doPrivileged(Native Method) at javax.security.auth.Subject.doAs(Subject.java:396) at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1063) at org.apache.hadoop.mapred.Child.main(Child.java:211) This is on Cloudera's CDH3 release. Any ideas? Thanks! Yuval --20cf3040ead0229459049f15ceaf Content-Type: text/html; charset=ISO-8859-1 Content-Transfer-Encoding: quoted-printable Hello all,

I'm having trouble getting a large mappin= g job to complete. Several of thousands of mappers are failing with this er= ror:

java.io.FileNotFoundException: File does not exist: /data/hadoop/cache/mapr= ed/mapred/staging/yuval/.staging/job_201011120027_144772/job.split at org.apache.hadoop.hdfs.DFSClient$DFSInputStream.openInfo(DFSClient.java= :1586) at org.apache.hadoop.hdfs.DFSClient$DFSInputStream.<init>(DFSClient.= java:1577) at org.apache.hadoop.hdfs.DFSClient.open(DFSClient.java:428) at org.apache.hadoop.hdfs.DistributedFileSystem.open(DistributedFileSystem= .java:185) at org.apache.hadoop.fs.FileSystem.open(FileSystem.java:431) at org.apache.hadoop.mapred.MapTask.getSplitDetails(MapTask.java:325) at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:357) at org.apache.hadoop.mapred.MapTask.run(MapTask.java:317) at org.apache.hadoop.mapred.Child$4.run(Child.java:217) at java.security.AccessController.doPrivileged(Native Method) at javax.security.auth.Subject.doAs(Subject.java:396) at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformati= on.java:1063) at org.apache.hadoop.mapred.Child.main(Child.java:211)


This is on Cloudera's CDH3 release. Any ideas?

Thanks!
Yuval

--20cf3040ead0229459049f15ceaf--