Mailing-List: contact user-help@cassandra.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@cassandra.apache.org
Received-SPF: pass (athena.apache.org: domain of jian.fang.subscribe@gmail.com
 designates 209.85.210.48 as permitted sender)
MIME-Version: 1.0
In-Reply-To: <9B40159A-C39B-4E0C-9983-0093DD98B418@gmail.com>
References: 
 <CAAwryDXp2grO3dEdS4jqOfmpTuEf9KBntF-TA3_Tj3Gog42U7w@mail.gmail.com>
	<78A0B668-E656-472B-A78C-C6BD9C1DA935@gmail.com>
	<CAAwryDUVJXG7G+G9Uy=m8GFocKw_x7-w-1d7W1TXD9ZVj3cV+g@mail.gmail.com>
	<CAAwryDXtxO6C+iKYgbdj1ixPegF1pgUjRUb_wfhvTQ149BX9SQ@mail.gmail.com>
	<9B40159A-C39B-4E0C-9983-0093DD98B418@gmail.com>
Date: Thu, 28 Jul 2011 16:19:00 -0400
Message-ID: 
 <CAAwryDVjoprk-X3YTV14x9eemF0=U3zpKJF17hrxdD=+7NEXbQ@mail.gmail.com>
Subject: Re: Cassandra timeout exception when works with hadoop
From: Jian Fang <jian.fang.subscribe@gmail.com>
To: user@cassandra.apache.org
Content-Type: multipart/alternative; boundary=bcaec51f969f2144fa04a926e045

--bcaec51f969f2144fa04a926e045
Content-Type: text/plain; charset=ISO-8859-1

I did not set the consistency level because I didn't find this option in the
ConfigHelper class. I guess it should use level one by default.

Actually, I only twisted the word count example a bit. Here is the code
snippet,

        getConf().set(CONF_COLUMN_NAME, columnName);

        Job job = new Job(getConf(), KEYSPACE);
        job.setJarByClass(WorkIdFinder.class);
        job.setMapperClass(TokenizerMapper.class);
        job.setCombinerClass(ReducerToFilesystem.class);
        job.setReducerClass(ReducerToFilesystem.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        FileOutputFormat.setOutputPath(job, new Path(OUTPUT_PATH_PREFIX +
columnFamily));

        job.setInputFormatClass(ColumnFamilyInputFormat.class);

        ConfigHelper.setRpcPort(job.getConfiguration(), "9260");
        ConfigHelper.setInitialAddress(job.getConfiguration(),
"dnjsrcha01");
        ConfigHelper.setPartitioner(job.getConfiguration(),
"org.apache.cassandra.dht.RandomPartitioner");
        ConfigHelper.setInputColumnFamily(job.getConfiguration(), KEYSPACE,
columnFamily);
        ConfigHelper.setRangeBatchSize(job.getConfiguration(), batchSize);
        SlicePredicate predicate = new
SlicePredicate().setColumn_names(Arrays.asList(ByteBufferUtil.bytes(columnName)));
        ConfigHelper.setInputSlicePredicate(job.getConfiguration(),
predicate);

Yes, I have one task tracker running on each Cassandra node.

Thanks,

John


On Thu, Jul 28, 2011 at 3:51 PM, Jeremy Hanna <jeremy.hanna1234@gmail.com>wrote:

> Just wondering - what consistency level are you using for hadoop reads?
>  Also, do you have task trackers running on the cassandra nodes so that
> reads will be local?
>
> On Jul 28, 2011, at 2:46 PM, Jian Fang wrote:
>
> > I changed the rpc_timeout_in_ms to 30000 and 40000, then changed the
> cassandra.range.batch.size from 4096 to 1024,
> > but still 40% tasks got timeout exceptions.
> >
> > Not sure if this is caused by Cassandra speed performance (8G heap size
> for about 100G of data) or the way how the Cassandra-hadoop integration
> > is implemented. I rarely saw any timeout exceptions when I use hector to
> get back data.
> >
> > Thanks,
> >
> > John
> >
> > On Thu, Jul 28, 2011 at 12:45 PM, Jian Fang <
> jian.fang.subscribe@gmail.com> wrote:
> >
> > My current setting is 10000. I will try 30000.
> >
> > Thanks,
> >
> > John
> >
> > On Thu, Jul 28, 2011 at 12:39 PM, Jeremy Hanna <
> jeremy.hanna1234@gmail.com> wrote:
> > See http://wiki.apache.org/cassandra/HadoopSupport#Troubleshooting - I
> would probably start with setting your rpc_timeout_in_ms to something like
> 30000.
> >
> > On Jul 28, 2011, at 11:09 AM, Jian Fang wrote:
> >
> > > Hi,
> > >
> > > I run Cassandra 0.8.2 and hadoop 0.20.2 on three nodes, each node
> includes a Cassandra instance and a hadoop data node.
> > > I created a simple hadoop job to scan a Cassandra column value in a
> column family and write it to a file system if it meets some conditions.
> > > I keep getting the following timeout exceptions. Is this caused by my
> settings in Cassandra? Or how could I change the timeout value on the
> > > Cassandra Hadoop API to get around this problem?
> > >
> > >
> > > 11/07/28 12:02:47 INFO mapred.JobClient: Task Id :
> attempt_201107281151_0001_m_000052_0, Status : FAILED
> > > java.lang.RuntimeException: TimedOutException()
> > >     at
> org.apache.cassandra.hadoop.ColumnFamilyRecordReader$RowIterator.maybeInit(ColumnFamilyRecordReader.java:265)
> > >     at
> org.apache.cassandra.hadoop.ColumnFamilyRecordReader$RowIterator.computeNext(ColumnFamilyRecordReader.java:279)
> > >     at
> org.apache.cassandra.hadoop.ColumnFamilyRecordReader$RowIterator.computeNext(ColumnFamilyRecordReader.java:177)
> > >     at
> com.google.common.collect.AbstractIterator.tryToComputeNext(AbstractIterator.java:140)
> > >     at
> com.google.common.collect.AbstractIterator.hasNext(AbstractIterator.java:135)
> > >     at
> org.apache.cassandra.hadoop.ColumnFamilyRecordReader.nextKeyValue(ColumnFamilyRecordReader.java:136)
> > >     at
> org.apache.hadoop.mapred.MapTask$NewTrackingRecordReader.nextKeyValue(MapTask.java:423)
> > >     at
> org.apache.hadoop.mapreduce.MapContext.nextKeyValue(MapContext.java:67)
> > >     at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:143)
> > >     at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:621)
> > >     at org.apache.hadoop.mapred.MapTask.run(MapTask.java:305)
> > >     at org.apache.hadoop.mapred.Child.main(Child.java:170)
> > > Caused by: TimedOutException()
> > >     at
> org.apache.cassandra.thrift.Cassandra$get_range_slices_result.read(Cassandra.java:12590)
> > >     at
> org.apache.cassandra.thrift.Cassandra$Client.recv_get_range_slices(Cassandra.java:762)
> > >     at
> org.apache.cassandra.thrift.Cassandra$Client.get_range_slices(Cassandra.java:734)
> > >     at
> org.apache.cassandra.hadoop.ColumnFamilyRecordReader$RowIterator.maybeInit(ColumnFamilyRecordReader.java:243)
> > >     ... 11 more
> > >
> > > Thanks in advance,
> > >
> > > John
> >
> >
> >
>
>

--bcaec51f969f2144fa04a926e045
Content-Type: text/html; charset=ISO-8859-1
Content-Transfer-Encoding: quoted-printable

I did not set the consistency level because I didn&#39;t find this option i=
n the ConfigHelper class. I guess it should use level one by default. <br><=
br>Actually, I only twisted the word count example a bit. Here is the code =
snippet,<br>
<br>=A0=A0=A0=A0=A0=A0=A0 getConf().set(CONF_COLUMN_NAME, columnName);<br><=
br>=A0=A0=A0=A0=A0=A0=A0 Job job =3D new Job(getConf(), KEYSPACE);<br>=A0=
=A0=A0=A0=A0=A0=A0 job.setJarByClass(WorkIdFinder.class);<br>=A0=A0=A0=A0=
=A0=A0=A0 job.setMapperClass(TokenizerMapper.class);<br>=A0=A0=A0=A0=A0=A0=
=A0 job.setCombinerClass(ReducerToFilesystem.class);<br>
=A0=A0=A0=A0=A0=A0=A0 job.setReducerClass(ReducerToFilesystem.class);<br>=
=A0=A0=A0=A0=A0=A0=A0 job.setOutputKeyClass(Text.class);<br>=A0=A0=A0=A0=A0=
=A0=A0 job.setOutputValueClass(IntWritable.class);<br>=A0=A0=A0=A0=A0=A0=A0=
 FileOutputFormat.setOutputPath(job, new Path(OUTPUT_PATH_PREFIX + columnFa=
mily));<br>
<br>=A0=A0=A0=A0=A0=A0=A0 job.setInputFormatClass(ColumnFamilyInputFormat.c=
lass);<br><br>=A0=A0=A0=A0=A0=A0=A0 ConfigHelper.setRpcPort(job.getConfigur=
ation(), &quot;9260&quot;);<br>=A0=A0=A0=A0=A0=A0=A0 ConfigHelper.setInitia=
lAddress(job.getConfiguration(), &quot;dnjsrcha01&quot;);<br>
=A0=A0=A0=A0=A0=A0=A0 ConfigHelper.setPartitioner(job.getConfiguration(), &=
quot;org.apache.cassandra.dht.RandomPartitioner&quot;);<br>=A0=A0=A0=A0=A0=
=A0=A0 ConfigHelper.setInputColumnFamily(job.getConfiguration(), KEYSPACE, =
columnFamily);<br>=A0=A0=A0=A0=A0=A0=A0 ConfigHelper.setRangeBatchSize(job.=
getConfiguration(), batchSize);<br>
=A0=A0=A0=A0=A0=A0=A0 SlicePredicate predicate =3D new SlicePredicate().set=
Column_names(Arrays.asList(ByteBufferUtil.bytes(columnName)));<br>=A0=A0=A0=
=A0=A0=A0=A0 ConfigHelper.setInputSlicePredicate(job.getConfiguration(), pr=
edicate);<br><br>Yes, I have one task tracker running on each Cassandra nod=
e.<br>
<br>Thanks,<br><br>John<br><br><br><div class=3D"gmail_quote">On Thu, Jul 2=
8, 2011 at 3:51 PM, Jeremy Hanna <span dir=3D"ltr">&lt;<a href=3D"mailto:je=
remy.hanna1234@gmail.com">jeremy.hanna1234@gmail.com</a>&gt;</span> wrote:<=
br>
<blockquote class=3D"gmail_quote" style=3D"margin: 0pt 0pt 0pt 0.8ex; borde=
r-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">Just wondering - =
what consistency level are you using for hadoop reads? =A0Also, do you have=
 task trackers running on the cassandra nodes so that reads will be local?<=
br>

<div><div></div><div class=3D"h5"><br>
On Jul 28, 2011, at 2:46 PM, Jian Fang wrote:<br>
<br>
&gt; I changed the rpc_timeout_in_ms to 30000 and 40000, then changed the c=
assandra.range.batch.size from 4096 to 1024,<br>
&gt; but still 40% tasks got timeout exceptions.<br>
&gt;<br>
&gt; Not sure if this is caused by Cassandra speed performance (8G heap siz=
e for about 100G of data) or the way how the Cassandra-hadoop integration<b=
r>
&gt; is implemented. I rarely saw any timeout exceptions when I use hector =
to get back data.<br>
&gt;<br>
&gt; Thanks,<br>
&gt;<br>
&gt; John<br>
&gt;<br>
&gt; On Thu, Jul 28, 2011 at 12:45 PM, Jian Fang &lt;<a href=3D"mailto:jian=
.fang.subscribe@gmail.com">jian.fang.subscribe@gmail.com</a>&gt; wrote:<br>
&gt;<br>
&gt; My current setting is 10000. I will try 30000.<br>
&gt;<br>
&gt; Thanks,<br>
&gt;<br>
&gt; John<br>
&gt;<br>
&gt; On Thu, Jul 28, 2011 at 12:39 PM, Jeremy Hanna &lt;<a href=3D"mailto:j=
eremy.hanna1234@gmail.com">jeremy.hanna1234@gmail.com</a>&gt; wrote:<br>
&gt; See <a href=3D"http://wiki.apache.org/cassandra/HadoopSupport#Troubles=
hooting" target=3D"_blank">http://wiki.apache.org/cassandra/HadoopSupport#T=
roubleshooting</a> - I would probably start with setting your rpc_timeout_i=
n_ms to something like 30000.<br>

&gt;<br>
&gt; On Jul 28, 2011, at 11:09 AM, Jian Fang wrote:<br>
&gt;<br>
&gt; &gt; Hi,<br>
&gt; &gt;<br>
&gt; &gt; I run Cassandra 0.8.2 and hadoop 0.20.2 on three nodes, each node=
 includes a Cassandra instance and a hadoop data node.<br>
&gt; &gt; I created a simple hadoop job to scan a Cassandra column value in=
 a column family and write it to a file system if it meets some conditions.=
<br>
&gt; &gt; I keep getting the following timeout exceptions. Is this caused b=
y my settings in Cassandra? Or how could I change the timeout value on the<=
br>
&gt; &gt; Cassandra Hadoop API to get around this problem?<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; 11/07/28 12:02:47 INFO mapred.JobClient: Task Id : attempt_201107=
281151_0001_m_000052_0, Status : FAILED<br>
&gt; &gt; java.lang.RuntimeException: TimedOutException()<br>
&gt; &gt; =A0 =A0 at org.apache.cassandra.hadoop.ColumnFamilyRecordReader$R=
owIterator.maybeInit(ColumnFamilyRecordReader.java:265)<br>
&gt; &gt; =A0 =A0 at org.apache.cassandra.hadoop.ColumnFamilyRecordReader$R=
owIterator.computeNext(ColumnFamilyRecordReader.java:279)<br>
&gt; &gt; =A0 =A0 at org.apache.cassandra.hadoop.ColumnFamilyRecordReader$R=
owIterator.computeNext(ColumnFamilyRecordReader.java:177)<br>
&gt; &gt; =A0 =A0 at com.google.common.collect.AbstractIterator.tryToComput=
eNext(AbstractIterator.java:140)<br>
&gt; &gt; =A0 =A0 at com.google.common.collect.AbstractIterator.hasNext(Abs=
tractIterator.java:135)<br>
&gt; &gt; =A0 =A0 at org.apache.cassandra.hadoop.ColumnFamilyRecordReader.n=
extKeyValue(ColumnFamilyRecordReader.java:136)<br>
&gt; &gt; =A0 =A0 at org.apache.hadoop.mapred.MapTask$NewTrackingRecordRead=
er.nextKeyValue(MapTask.java:423)<br>
&gt; &gt; =A0 =A0 at org.apache.hadoop.mapreduce.MapContext.nextKeyValue(Ma=
pContext.java:67)<br>
&gt; &gt; =A0 =A0 at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:143=
)<br>
&gt; &gt; =A0 =A0 at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.=
java:621)<br>
&gt; &gt; =A0 =A0 at org.apache.hadoop.mapred.MapTask.run(MapTask.java:305)=
<br>
&gt; &gt; =A0 =A0 at org.apache.hadoop.mapred.Child.main(Child.java:170)<br=
>
&gt; &gt; Caused by: TimedOutException()<br>
&gt; &gt; =A0 =A0 at org.apache.cassandra.thrift.Cassandra$get_range_slices=
_result.read(Cassandra.java:12590)<br>
&gt; &gt; =A0 =A0 at org.apache.cassandra.thrift.Cassandra$Client.recv_get_=
range_slices(Cassandra.java:762)<br>
&gt; &gt; =A0 =A0 at org.apache.cassandra.thrift.Cassandra$Client.get_range=
_slices(Cassandra.java:734)<br>
&gt; &gt; =A0 =A0 at org.apache.cassandra.hadoop.ColumnFamilyRecordReader$R=
owIterator.maybeInit(ColumnFamilyRecordReader.java:243)<br>
&gt; &gt; =A0 =A0 ... 11 more<br>
&gt; &gt;<br>
&gt; &gt; Thanks in advance,<br>
&gt; &gt;<br>
&gt; &gt; John<br>
&gt;<br>
&gt;<br>
&gt;<br>
<br>
</div></div></blockquote></div><br>

--bcaec51f969f2144fa04a926e045--