Mailing-List: contact common-user-help@hadoop.apache.org; run by ezmlm
Precedence: bulk
Reply-To: common-user@hadoop.apache.org
Received-SPF: pass (nike.apache.org: domain of zhenhe.yk@gmail.com designates
 209.85.210.176 as permitted sender)
Received-SPF: pass (google.com: domain of zhenhe.yk@gmail.com designates
 10.42.135.129 as permitted sender) client-ip=10.42.135.129;
From: "yuan kui" <zhenhe.yk@gmail.com>
To: <common-user@hadoop.apache.org>
References: <4f4600e5.691d440a.6e94.201bSMTPIN_ADDED@mx.google.com>
 <CAOcnVr1V6zrb6zQ3rBTXZSfg2PiNuJ=Bg+tEomhFL-Rr8vHmaQ@mail.gmail.com>
 <001301ccf213$5e070300$1a150900$@tian@ia.ac.cn>
 <4f46e2db.0718440a.2d8a.328bSMTPIN_ADDED@mx.google.com>
In-Reply-To: <4f46e2db.0718440a.2d8a.328bSMTPIN_ADDED@mx.google.com>
Subject: The distributed cache object hdfs://xxxxxxxx  changed during the job
 from TIMESTAMP to TIMESTAMP
Date: Fri, 24 Feb 2012 09:52:31 +0800
Message-ID: <4f46ed64.46ed320a.217c.0a3c@mx.google.com>
MIME-Version: 1.0
Content-Type: text/plain;
	charset="utf-8"
Content-Transfer-Encoding: quoted-printable
Thread-Index: AczyDfU/LHrCU2iUR3SEByJ2RFu6GAAA0T0wAB/JqyAAAVXRgA==
Content-Language: zh-cn

Hi,all
I was running a hbase bulkload job with ImportTsv.jar when I got an =
Exception:


-----------------------------------------------
12/02/24 08:05:42 INFO mapred.JobClient: Running job: =
job_201202092344_617328
12/02/24 08:05:43 INFO mapred.JobClient:  map 0% reduce 0%=20
12/02/24 08:06:52 INFO mapred.JobClient: Task Id : =
attempt_201202092344_617328_m_000000_0, Status : FAILED
Error initializing attempt_201202092344_617328_m_000000_0:
java.io.IOException: The distributed cache object =
hdfs://dump002002.cm8:9000/user/admin/partitions_1330041940677#_partition=
.lst changed during the job from 2/24/12 8:05 AM to 2/24/12 8:06 AM
    at =
org.apache.hadoop.filecache.TrackerDistributedCacheManager.downloadCacheO=
bject(TrackerDistributedCacheManager.java:391)
    at =
org.apache.hadoop.filecache.TrackerDistributedCacheManager.localizePublic=
CacheObject(TrackerDistributedCacheManager.java:465)
    at =
org.apache.hadoop.filecache.TrackerDistributedCacheManager.getLocalCache(=
TrackerDistributedCacheManager.java:191)
    at =
org.apache.hadoop.filecache.TaskDistributedCacheManager.setupCache(TaskDi=
stributedCacheManager.java:183)
    at org.apache.hadoop.mapred.TaskTracker$4.run(TaskTracker.java:1184)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:396)
    at =
org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation=
.java:1127)
    at =
org.apache.hadoop.mapred.TaskTracker.initializeJob(TaskTracker.java:1175)=

    at =
org.apache.hadoop.mapred.TaskTracker.localizeJob(TaskTracker.java:1090)
    at =
org.apache.hadoop.mapred.TaskTracker.startNewTask(TaskTracker.java:2291)
    at =
org.apache.hadoop.mapred.TaskTracker$StartNewTask.run(TaskTracker.java:21=
36)

12/02/24 08:06:52 WARN mapred.JobClient: Error reading task =
outputhttp://dump002102.cm8:50060/tasklog?plaintext=3Dtrue&attemptid=3Dat=
tempt_201202092344_617328_m_000000_0&filter=3Dstdout
12/02/24 08:06:52 WARN mapred.JobClient: Error reading task =
outputhttp://dump002102.cm8:50060/tasklog?plaintext=3Dtrue&attemptid=3Dat=
tempt_201202092344_617328_m_000000_0&filter=3Dstderr
12/02/24 08:06:52 INFO mapred.JobClient: Task Id : =
attempt_201202092344_617328_m_000001_0, Status : FAILED
Error initializing attempt_201202092344_617328_m_000001_0:
java.io.IOException: The distributed cache object =
hdfs://dump002002.cm8:9000/user/admin/partitions_1330041940677#_partition=
.lst changed during the job from 2/24/12 8:05 AM to 2/24/12 8:06 AM
    at =
org.apache.hadoop.filecache.TrackerDistributedCacheManager.downloadCacheO=
bject(TrackerDistributedCacheManager.java:391)
    at =
org.apache.hadoop.filecache.TrackerDistributedCacheManager.localizePublic=
CacheObject(TrackerDistributedCacheManager.java:465)
    at =
org.apache.hadoop.filecache.TrackerDistributedCacheManager.getLocalCache(=
TrackerDistributedCacheManager.java:191)
    at =
org.apache.hadoop.filecache.TaskDistributedCacheManager.setupCache(TaskDi=
stributedCacheManager.java:183)
    at org.apache.hadoop.mapred.TaskTracker$4.run(TaskTracker.java:1184)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:396)
    at =
org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation=
.java:1127)
    at =
org.apache.hadoop.mapred.TaskTracker.initializeJob(TaskTracker.java:1175)=

    at =
org.apache.hadoop.mapred.TaskTracker.localizeJob(TaskTracker.java:1090)
    at =
org.apache.hadoop.mapred.TaskTracker.startNewTask(TaskTracker.java:2291)
---------------------------------------------------------------------

Although the same job may run successfully later again. But failure =
Makes me miserable.
Is this a hadoop bug? How to avoid this?