Mailing-List: contact user-help@cassandra.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@cassandra.apache.org
Received-SPF: pass (nike.apache.org: local policy)
DomainKey-Signature: a=rsa-sha1; c=nofws; d=thelastpickle.com; h=from
	:mime-version:content-type:subject:date:in-reply-to:to
	:references:message-id; q=dns; s=thelastpickle.com; b=J+X3ZcuUWq
	ZB1+RSEcbGp3ZHay6klkyUwj2//H6WfNBMHV6v/yIgrN4xe/Re8oQUDWRQx1Q/vq
	ArreeE+1coVMsWwkgqogkZ7WOeMZWCOW/efRtsztVWzFM6Ex4p5oUtb//3azA5RK
	Rbg+HtYvlo8Cy9Ldmg3F+PjOcVme+u/mc=
From: aaron morton <aaron@thelastpickle.com>
Mime-Version: 1.0 (Apple Message framework v1244.3)
Content-Type: multipart/alternative;
 boundary="Apple-Mail=_595EBDDA-4BD5-491C-B45D-86254C69A7F0"
Subject: Re: ColumnFamilyOutputFormat problem
Date: Thu, 11 Aug 2011 09:40:04 +1200
In-Reply-To: 
 <CAAwryDUF9kByD=-eHO1RVSCAYHs2MKn0WvZbRMgf=Ltmz2LFSQ@mail.gmail.com>
To: user@cassandra.apache.org
References: 
 <CAAwryDUF9kByD=-eHO1RVSCAYHs2MKn0WvZbRMgf=Ltmz2LFSQ@mail.gmail.com>
Message-Id: <375D0D7F-933B-4F68-99F0-73B9CBEB8E65@thelastpickle.com>


--Apple-Mail=_595EBDDA-4BD5-491C-B45D-86254C69A7F0
Content-Transfer-Encoding: quoted-printable
Content-Type: text/plain;
	charset=iso-8859-1

>  Seems the data are not actually written to Cassandra.

Before jumping into the Hadoop side of things are you saying there is no =
data in Cassandra ? Can you retrieve any using the CLI  ? Take a look at =
cfstats on each node to see the estimated record count.

Cheers
=20
-----------------
Aaron Morton
Freelance Cassandra Developer
@aaronmorton
http://www.thelastpickle.com

On 11 Aug 2011, at 08:20, Jian Fang wrote:

> Hi,
>=20
> I am using Cassandra 0.8.2 with Hadoop 0.20.2. My application read a =
file and then write about 2.5 million records
> to Cassandra. I used ColumnFamilyOutputFormat to write to Cassandra. =
My Cassandra cluster has three nodes with
> one Hadoop task tracker on each node. The wired problem is that I only =
saw one map and one reducer tasks and job only took
> 53 seconds to finish. Seems the data are not actually written to =
Cassandra.
>=20
> Here is status from Hadoop web admin:
>=20
> User: hadoop
> Job Name: SalesRankWriter
> Job File: =
hdfs://xxxxx:54310/hadoop/tmp/mapred/system/job_201108051329_0060/job.xml
> Job Setup: Successful
> Status: Succeeded
> Started at: Wed Aug 10 15:24:43 EDT 2011
> Finished at: Wed Aug 10 15:25:36 EDT 2011
> Finished in: 52sec
> Job Cleanup: Successful
> Kind	% Complete	Num Tasks	Pending	Running	Complete	=
Killed	Failed/Killed
> Task Attempts
> map	100.00%
> 1	0	0	1	0	0 / 0
> reduce	100.00%
> 1	0	0	1	0	0 / 0
>=20
> Counter	Map	Reduce	Total
> Job Counters	Launched reduce tasks	0	0	1
> Launched map tasks	0	0	1
> Data-local map tasks	0	0	1
> FileSystemCounters	FILE_BYTES_READ	50,698,700	50,698,646	=
101,397,346
> HDFS_BYTES_READ	56,149,360	0	56,149,360
> FILE_BYTES_WRITTEN	101,397,378	50,698,646	152,096,024
> Map-Reduce Framework	Reduce input groups	0	2,534,932	=
2,534,932
> Combine output records	0	0	0
> Map input records	2,534,932	0	2,534,932
> Reduce shuffle bytes	0	0	0
> Reduce output records	0	2,534,932	2,534,932
> Spilled Records	5,069,864	2,534,932	7,604,796
> Map output bytes	45,628,776	0	45,628,776
> Map output records	2,534,932	0	2,534,932
> Combine input records	0	0	0
> Reduce input records	0	2,534,932	2,534,932
>=20
> and the log for the mapper
>=20
>  2011-08-10 15:24:48,717 INFO =
org.apache.hadoop.metrics.jvm.JvmMetrics: Initializing JVM Metrics with =
processName=3DMAP, sessionId=3D
> 2011-08-10 15:24:48,857 INFO org.apache.hadoop.mapred.MapTask: =
io.sort.mb =3D 100
> 2011-08-10 15:24:48,917 INFO org.apache.hadoop.mapred.MapTask: data =
buffer =3D 79691776/99614720
> 2011-08-10 15:24:48,917 INFO org.apache.hadoop.mapred.MapTask: record =
buffer =3D 262144/327680
> 2011-08-10 15:24:49,760 INFO org.apache.hadoop.mapred.MapTask: =
Spilling map output: record full =3D true
> 2011-08-10 15:24:49,760 INFO org.apache.hadoop.mapred.MapTask: =
bufstart =3D 0; bufend =3D 4718592; bufvoid =3D 99614720
> 2011-08-10 15:24:49,760 INFO org.apache.hadoop.mapred.MapTask: kvstart =
=3D 0; kvend =3D 262144; length =3D 327680
> 2011-08-10 15:24:50,364 INFO org.apache.hadoop.mapred.MapTask: =
Finished spill 0
> 2011-08-10 15:24:50,707 INFO org.apache.hadoop.mapred.MapTask: =
Spilling map output: record full =3D true
> 2011-08-10 15:24:50,707 INFO org.apache.hadoop.mapred.MapTask: =
bufstart =3D 4718592; bufend =3D 9437166; bufvoid =3D 99614720
> 2011-08-10 15:24:50,707 INFO org.apache.hadoop.mapred.MapTask: kvstart =
=3D 262144; kvend =3D 196607; length =3D 327680
> 2011-08-10 15:24:51,238 INFO org.apache.hadoop.mapred.MapTask: =
Finished spill 1
> 2011-08-10 15:24:51,583 INFO org.apache.hadoop.mapred.MapTask: =
Spilling map output: record full =3D true
> 2011-08-10 15:24:51,583 INFO org.apache.hadoop.mapred.MapTask: =
bufstart =3D 9437166; bufend =3D 14155740; bufvoid =3D 99614720
> 2011-08-10 15:24:51,583 INFO org.apache.hadoop.mapred.MapTask: kvstart =
=3D 196607; kvend =3D 131070; length =3D 327680
> 2011-08-10 15:24:52,084 INFO org.apache.hadoop.mapred.MapTask: =
Finished spill 2
> 2011-08-10 15:24:52,433 INFO org.apache.hadoop.mapred.MapTask: =
Spilling map output: record full =3D true
> 2011-08-10 15:24:52,433 INFO org.apache.hadoop.mapred.MapTask: =
bufstart =3D 14155740; bufend =3D 18874314; bufvoid =3D 99614720
> 2011-08-10 15:24:52,433 INFO org.apache.hadoop.mapred.MapTask: kvstart =
=3D 131070; kvend =3D 65533; length =3D 327680
> 2011-08-10 15:24:52,877 INFO org.apache.hadoop.mapred.MapTask: =
Finished spill 3
> 2011-08-10 15:24:53,216 INFO org.apache.hadoop.mapred.MapTask: =
Spilling map output: record full =3D true
> 2011-08-10 15:24:53,216 INFO org.apache.hadoop.mapred.MapTask: =
bufstart =3D 18874314; bufend =3D 23592906; bufvoid =3D 99614720
> 2011-08-10 15:24:53,216 INFO org.apache.hadoop.mapred.MapTask: kvstart =
=3D 65533; kvend =3D 327677; length =3D 327680
> 2011-08-10 15:24:53,660 INFO org.apache.hadoop.mapred.MapTask: =
Finished spill 4
> 2011-08-10 15:24:54,010 INFO org.apache.hadoop.mapred.MapTask: =
Spilling map output: record full =3D true
> 2011-08-10 15:24:54,010 INFO org.apache.hadoop.mapred.MapTask: =
bufstart =3D 23592906; bufend =3D 28311480; bufvoid =3D 99614720
> 2011-08-10 15:24:54,010 INFO org.apache.hadoop.mapred.MapTask: kvstart =
=3D 327677; kvend =3D 262140; length =3D 327680
> 2011-08-10 15:24:54,447 INFO org.apache.hadoop.mapred.MapTask: =
Finished spill 5
> 2011-08-10 15:24:54,793 INFO org.apache.hadoop.mapred.MapTask: =
Spilling map output: record full =3D true
> 2011-08-10 15:24:54,793 INFO org.apache.hadoop.mapred.MapTask: =
bufstart =3D 28311480; bufend =3D 33030054; bufvoid =3D 99614720
> 2011-08-10 15:24:54,793 INFO org.apache.hadoop.mapred.MapTask: kvstart =
=3D 262140; kvend =3D 196603; length =3D 327680
> 2011-08-10 15:24:55,237 INFO org.apache.hadoop.mapred.MapTask: =
Finished spill 6
> 2011-08-10 15:24:55,564 INFO org.apache.hadoop.mapred.MapTask: =
Spilling map output: record full =3D true
> 2011-08-10 15:24:55,564 INFO org.apache.hadoop.mapred.MapTask: =
bufstart =3D 33030054; bufend =3D 37748628; bufvoid =3D 99614720
> 2011-08-10 15:24:55,564 INFO org.apache.hadoop.mapred.MapTask: kvstart =
=3D 196603; kvend =3D 131066; length =3D 327680
> 2011-08-10 15:24:55,981 INFO org.apache.hadoop.mapred.MapTask: =
Finished spill 7
> 2011-08-10 15:24:56,434 INFO org.apache.hadoop.mapred.MapTask: =
Spilling map output: record full =3D true
> 2011-08-10 15:24:56,434 INFO org.apache.hadoop.mapred.MapTask: =
bufstart =3D 37748628; bufend =3D 42467202; bufvoid =3D 99614720
> 2011-08-10 15:24:56,434 INFO org.apache.hadoop.mapred.MapTask: kvstart =
=3D 131066; kvend =3D 65529; length =3D 327680
> 2011-08-10 15:24:56,848 INFO org.apache.hadoop.mapred.MapTask: =
Finished spill 8
> 2011-08-10 15:24:57,051 INFO org.apache.hadoop.mapred.MapTask: =
Starting flush of map output
> 2011-08-10 15:24:57,282 INFO org.apache.hadoop.mapred.MapTask: =
Finished spill 9
> 2011-08-10 15:24:57,291 INFO org.apache.hadoop.mapred.Merger: Merging =
10 sorted segments
> 2011-08-10 15:24:57,297 INFO org.apache.hadoop.mapred.Merger: Down to =
the last merge-pass, with 10 segments left of total size: 50698660 bytes
> 2011-08-10 15:24:59,552 INFO org.apache.hadoop.mapred.TaskRunner: =
Task:attempt_201108051329_0060_m_000000_0 is done. And is in the process =
of commiting
> 2011-08-10 15:24:59,555 INFO org.apache.hadoop.mapred.TaskRunner: Task =
'attempt_201108051329_0060_m_000000_0' done.
>=20
> and the log for the reducer
>=20
> 2011-08-10 15:25:00,835 INFO org.apache.hadoop.metrics.jvm.JvmMetrics: =
Initializing JVM Metrics with processName=3DSHUFFLE, sessionId=3D
> 2011-08-10 15:25:01,005 INFO org.apache.hadoop.mapred.ReduceTask: =
ShuffleRamManager: MemoryLimit=3D140699232, =
MaxSingleShuffleLimit=3D35174808
> 2011-08-10 15:25:01,022 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Thread started: Thread for merging =
on-disk files
> 2011-08-10 15:25:01,022 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Thread started: Thread for merging =
in memory files
> 2011-08-10 15:25:01,022 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Thread waiting: Thread for merging =
on-disk files
> 2011-08-10 15:25:01,024 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Need another 1 map output(s) where =
0 is already in progress
> 2011-08-10 15:25:01,024 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Thread started: Thread for polling =
Map Completion Events
> 2011-08-10 15:25:01,037 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Scheduled 0 outputs (0 slow hosts =
and0 dup hosts)
> 2011-08-10 15:25:01,038 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0: Got 1 new map-outputs
> 2011-08-10 15:25:06,039 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Scheduled 1 outputs (0 slow hosts =
and0 dup hosts)
> 2011-08-10 15:25:06,121 INFO org.apache.hadoop.mapred.ReduceTask: =
header: attempt_201108051329_0060_m_000000_0, compressed len: 50698646, =
decompressed len: 50698642
> 2011-08-10 15:25:06,121 INFO org.apache.hadoop.mapred.ReduceTask: =
Shuffling 50698642 bytes (50698646 raw bytes) into Local-FS from =
attempt_201108051329_0060_m_000000_0
> 2011-08-10 15:25:06,314 INFO org.apache.hadoop.mapred.ReduceTask: Read =
50698646 bytes from map-output for attempt_201108051329_0060_m_000000_0
> 2011-08-10 15:25:06,315 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Thread waiting: Thread for merging =
on-disk files
> 2011-08-10 15:25:07,055 INFO org.apache.hadoop.mapred.ReduceTask: =
GetMapEventsThread exiting
> 2011-08-10 15:25:07,055 INFO org.apache.hadoop.mapred.ReduceTask: =
getMapsEventsThread joined.
> 2011-08-10 15:25:07,056 INFO org.apache.hadoop.mapred.ReduceTask: =
Closed ram manager
> 2011-08-10 15:25:07,056 INFO org.apache.hadoop.mapred.ReduceTask: =
Interleaved on-disk merge complete: 1 files left.
> 2011-08-10 15:25:07,056 INFO org.apache.hadoop.mapred.ReduceTask: =
In-memory merge complete: 0 files left.
> 2011-08-10 15:25:07,061 INFO org.apache.hadoop.mapred.ReduceTask: =
Merging 1 files, 50698646 bytes from disk
> 2011-08-10 15:25:07,062 INFO org.apache.hadoop.mapred.ReduceTask: =
Merging 0 segments, 0 bytes from memory into reduce
> 2011-08-10 15:25:07,065 INFO org.apache.hadoop.mapred.Merger: Merging =
1 sorted segments
> 2011-08-10 15:25:07,072 INFO org.apache.hadoop.mapred.Merger: Down to =
the last merge-pass, with 1 segments left of total size: 50698642 bytes
> 2011-08-10 15:25:30,126 INFO org.apache.hadoop.mapred.TaskRunner: =
Task:attempt_201108051329_0060_r_000000_0 is done. And is in the process =
of commiting
> 2011-08-10 15:25:30,129 INFO org.apache.hadoop.mapred.TaskRunner: Task =
'attempt_201108051329_0060_r_000000_0' done.
>=20
> My code is similar to the word count example:
>=20
>     public int run(String[] args) throws Exception {
>         ...
>=20
>         getConf().set(CONF_COLUMN_NAME, columnName);
>=20
>         Job job4 =3D new Job(getConf(), "SalesRankWriter");
>         job4.setJarByClass(SalesRankLoader.class);
>         job4.setMapperClass(RankUpdateMapper.class);
>         job4.setReducerClass(RankUpdateReducer.class);
>         job4.setMapOutputKeyClass(Text.class);
>         job4.setMapOutputValueClass(IntWritable.class);
>         job4.setOutputKeyClass(ByteBuffer.class);
>         job4.setOutputValueClass(List.class);
>         job4.setOutputFormatClass(ColumnFamilyOutputFormat.class);
>         job4.setInputFormatClass(TextInputFormat.class);
>         FileInputFormat.addInputPath(job4, new Path(prePath));
>=20
>         ConfigHelper.setOutputColumnFamily(job4.getConfiguration(), =
KEYSPACE, columnFamily);
>         ConfigHelper.setRpcPort(job4.getConfiguration(), "9260");
>         ConfigHelper.setInitialAddress(job4.getConfiguration(), =
"dnjsrcha01");
>         ConfigHelper.setPartitioner(job4.getConfiguration(), =
"org.apache.cassandra.dht.RandomPartitioner");
>=20
>=20
>         job4.waitForCompletion(true);
>         ...
>     }
>=20
>=20
> where the mapper and reducer are defined as:
>=20
>     public static class RankUpdateMapper extends Mapper<LongWritable, =
Text, Text, IntWritable> {
>         public void map(LongWritable key, Text value, Context context) =
throws IOException, InterruptedException {
>             String line =3D value.toString();
>             StringTokenizer tokenizer =3D new StringTokenizer(line);
>             String ean =3D tokenizer.nextToken();
>             int rank =3D Integer.parseInt(tokenizer.nextToken());
>=20
>             context.write(new Text(ean), new IntWritable(rank));
>         }
>     }
>=20
>     public static class RankUpdateReducer extends Reducer<Text, =
IntWritable, ByteBuffer, List<Mutation>>
>     {
>         private ByteBuffer outputKey;
>=20
>         protected void =
setup(org.apache.hadoop.mapreduce.Reducer.Context context) throws =
IOException, InterruptedException
>         {
>             outputKey =3D =
ByteBufferUtil.bytes(context.getConfiguration().get(CONF_COLUMN_NAME));
>         }
>=20
>         public void reduce(Text key, Iterable<IntWritable> values, =
Context context) throws IOException, InterruptedException
>         {
>             context.write(outputKey, =
Collections.singletonList(getMutation(key, =
values.iterator().next().get())));
>         }
>=20
>         private static Mutation getMutation(Text key, int value)
>         {
>             Column c =3D new Column();
>             c.setName(ByteBuffer.wrap(Arrays.copyOf(key.getBytes(), =
key.getLength())));
>             c.setValue(ByteBufferUtil.bytes(String.valueOf(value)));
>             c.setTimestamp(System.currentTimeMillis() * 1000);
>=20
>             Mutation m =3D new Mutation();
>             m.setColumn_or_supercolumn(new ColumnOrSuperColumn());
>             m.column_or_supercolumn.setColumn(c);
>             return m;
>         }
>     }
>=20
> Any thing wrong here?
>=20
> Thanks,
>=20
> John


--Apple-Mail=_595EBDDA-4BD5-491C-B45D-86254C69A7F0
Content-Transfer-Encoding: quoted-printable
Content-Type: text/html;
	charset=iso-8859-1

<html><head></head><body style=3D"word-wrap: break-word; =
-webkit-nbsp-mode: space; -webkit-line-break: after-white-space; =
"><div><blockquote type=3D"cite"><div>&nbsp;Seems the data are =
not&nbsp;actually&nbsp;written to =
Cassandra.</div></blockquote><br></div><div>Before jumping into the =
Hadoop side of things are you saying there is no data in Cassandra ? Can =
you retrieve any using the CLI &nbsp;? Take a look at cfstats on each =
node to see the estimated record =
count.</div><div><br></div><div>Cheers</div><div>&nbsp;<br><div>
<span class=3D"Apple-style-span" style=3D"border-collapse: separate; =
color: rgb(0, 0, 0); font-family: Helvetica; font-style: normal; =
font-variant: normal; font-weight: normal; letter-spacing: normal; =
line-height: normal; orphans: 2; text-align: auto; text-indent: 0px; =
text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; =
-webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: =
0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: =
auto; -webkit-text-stroke-width: 0px; font-size: medium; "><span =
class=3D"Apple-style-span" style=3D"border-collapse: separate; color: =
rgb(0, 0, 0); font-family: Helvetica; font-style: normal; font-variant: =
normal; font-weight: normal; letter-spacing: normal; line-height: =
normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: =
normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: =
0px; -webkit-border-vertical-spacing: 0px; =
-webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: =
auto; -webkit-text-stroke-width: 0px; font-size: medium; "><div =
style=3D"word-wrap: break-word; -webkit-nbsp-mode: space; =
-webkit-line-break: after-white-space; "><span class=3D"Apple-style-span" =
style=3D"border-collapse: separate; color: rgb(0, 0, 0); font-family: =
Helvetica; font-style: normal; font-variant: normal; font-weight: =
normal; letter-spacing: normal; line-height: normal; orphans: 2; =
text-indent: 0px; text-transform: none; white-space: normal; widows: 2; =
word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; =
-webkit-border-vertical-spacing: 0px; =
-webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: =
auto; -webkit-text-stroke-width: 0px; font-size: medium; "><div =
style=3D"word-wrap: break-word; -webkit-nbsp-mode: space; =
-webkit-line-break: after-white-space; =
"><div><div>-----------------</div><div>Aaron Morton</div><div>Freelance =
Cassandra Developer</div><div>@aaronmorton</div><div><a =
href=3D"http://www.thelastpickle.com">http://www.thelastpickle.com</a></di=
v></div></div></span></div></span></span>
</div>

<br><div><div>On 11 Aug 2011, at 08:20, Jian Fang wrote:</div><br =
class=3D"Apple-interchange-newline"><blockquote =
type=3D"cite">Hi,<div><br></div><div>I am using Cassandra 0.8.2 with =
Hadoop 0.20.2. My application read a file and then write about 2.5 =
million records</div><div>to Cassandra. I =
used&nbsp;ColumnFamilyOutputFormat to write to Cassandra. My Cassandra =
cluster has three nodes with</div>
<div>one Hadoop task tracker on each node. The wired problem is that I =
only saw one map and one reducer tasks and job only took</div><div>53 =
seconds to finish. Seems the data are not&nbsp;actually&nbsp;written to =
Cassandra.</div><div>
<br></div><div><div>Here is status from Hadoop web =
admin:</div><div><br></div><div><div>User: hadoop</div><div>Job Name: =
SalesRankWriter</div><div>Job File: <a =
href=3D"hdfs://xxxxx:54310/hadoop/tmp/mapred/system/job_201108051329_0060/=
job.xml">hdfs://xxxxx:54310/hadoop/tmp/mapred/system/job_201108051329_0060=
/job.xml</a></div>
<div>Job Setup: Successful</div><div>Status: Succeeded</div><div>Started =
at: Wed Aug 10 15:24:43 EDT 2011</div><div>Finished at: Wed Aug 10 =
15:25:36 EDT 2011</div><div>Finished in: 52sec</div><div>Job Cleanup: =
Successful</div>
</div><div>Kind<span class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>% Complete<span class=3D"Apple-tab-span" style=3D"white-space:pre">=
	</span>Num Tasks<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>Pending<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>Running<span class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>Complete<span class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>Killed<span class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>Failed/Killed</div>
<div>Task Attempts</div><div>map<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>100.00%</div><div>1<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>0<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>0<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>1<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>0<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>0 / =
0</div>
<div>reduce<span class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>100.00%</div><div>1<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>1<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0 / 0</div>
<div><br></div><div>Counter<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>Map<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>Reduce<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>Total</div>
<div>Job Counters<span class=3D"Apple-tab-span" style=3D"white-space:pre">=
	</span>Launched reduce tasks<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>1</div>
<div>Launched map tasks<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>1</div><div>Data-local map =
tasks<span class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>0<span class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>0<span class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>1</div>
<div>FileSystemCounters<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>FILE_BYTES_READ<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>50,698,700<span class=3D"Apple-tab-span" style=3D"white-space:pre">=
	</span>50,698,646<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>101,397,346</div>
<div>HDFS_BYTES_READ<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>56,149,360<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>0<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>56,149,360</div>
<div>FILE_BYTES_WRITTEN<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>101,397,378<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>50,698,646<span class=3D"Apple-tab-span" style=3D"white-space:pre">=
	</span>152,096,024</div>
<div>Map-Reduce Framework<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>Reduce input groups<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>0<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>2,534,932<span class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>2,534,932</div>
<div>Combine output records<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0</div><div>
Map input records<span class=3D"Apple-tab-span" style=3D"white-space:pre">=
	</span>2,534,932<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>2,534,932</div>
<div>Reduce shuffle bytes<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0</div><div>
Reduce output records<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>2,534,932<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>2,534,932</div>
<div>Spilled Records<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>5,069,864<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>2,534,932<span class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>7,604,796</div>
<div>Map output bytes<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>45,628,776<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>0<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>45,628,776</div>
<div>Map output records<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>2,534,932<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	</span>0<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>2,534,932</div>
<div>Combine input records<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0</div><div>
Reduce input records<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>0<span class=3D"Apple-tab-span" =
style=3D"white-space:pre">	</span>2,534,932<span =
class=3D"Apple-tab-span" style=3D"white-space:pre">	=
</span>2,534,932</div>
</div><div><br></div><div>and the log for the =
mapper</div><div><br></div><div>&nbsp;<span class=3D"Apple-style-span" =
style=3D"font-family: monospace; white-space: pre; font-size: medium; =
">2011-08-10 15:24:48,717 INFO org.apache.hadoop.metrics.jvm.JvmMetrics: =
Initializing JVM Metrics with processName=3DMAP, sessionId=3D</span></div>=

<meta http-equiv=3D"content-type" content=3D"text/html; =
charset=3Dutf-8"><span class=3D"Apple-style-span" style=3D"font-family: =
monospace; white-space: pre; font-size: medium; ">2011-08-10 =
15:24:48,857 INFO org.apache.hadoop.mapred.MapTask: io.sort.mb =3D 100
2011-08-10 15:24:48,917 INFO org.apache.hadoop.mapred.MapTask: data =
buffer =3D 79691776/99614720
2011-08-10 15:24:48,917 INFO org.apache.hadoop.mapred.MapTask: record =
buffer =3D 262144/327680
2011-08-10 15:24:49,760 INFO org.apache.hadoop.mapred.MapTask: Spilling =
map output: record full =3D true
2011-08-10 15:24:49,760 INFO org.apache.hadoop.mapred.MapTask: bufstart =
=3D 0; bufend =3D 4718592; bufvoid =3D 99614720
2011-08-10 15:24:49,760 INFO org.apache.hadoop.mapred.MapTask: kvstart =3D=
 0; kvend =3D 262144; length =3D 327680
2011-08-10 15:24:50,364 INFO org.apache.hadoop.mapred.MapTask: Finished =
spill 0
2011-08-10 15:24:50,707 INFO org.apache.hadoop.mapred.MapTask: Spilling =
map output: record full =3D true
2011-08-10 15:24:50,707 INFO org.apache.hadoop.mapred.MapTask: bufstart =
=3D 4718592; bufend =3D 9437166; bufvoid =3D 99614720
2011-08-10 15:24:50,707 INFO org.apache.hadoop.mapred.MapTask: kvstart =3D=
 262144; kvend =3D 196607; length =3D 327680
2011-08-10 15:24:51,238 INFO org.apache.hadoop.mapred.MapTask: Finished =
spill 1
2011-08-10 15:24:51,583 INFO org.apache.hadoop.mapred.MapTask: Spilling =
map output: record full =3D true
2011-08-10 15:24:51,583 INFO org.apache.hadoop.mapred.MapTask: bufstart =
=3D 9437166; bufend =3D 14155740; bufvoid =3D 99614720
2011-08-10 15:24:51,583 INFO org.apache.hadoop.mapred.MapTask: kvstart =3D=
 196607; kvend =3D 131070; length =3D 327680
2011-08-10 15:24:52,084 INFO org.apache.hadoop.mapred.MapTask: Finished =
spill 2
2011-08-10 15:24:52,433 INFO org.apache.hadoop.mapred.MapTask: Spilling =
map output: record full =3D true
2011-08-10 15:24:52,433 INFO org.apache.hadoop.mapred.MapTask: bufstart =
=3D 14155740; bufend =3D 18874314; bufvoid =3D 99614720
2011-08-10 15:24:52,433 INFO org.apache.hadoop.mapred.MapTask: kvstart =3D=
 131070; kvend =3D 65533; length =3D 327680
2011-08-10 15:24:52,877 INFO org.apache.hadoop.mapred.MapTask: Finished =
spill 3
2011-08-10 15:24:53,216 INFO org.apache.hadoop.mapred.MapTask: Spilling =
map output: record full =3D true
2011-08-10 15:24:53,216 INFO org.apache.hadoop.mapred.MapTask: bufstart =
=3D 18874314; bufend =3D 23592906; bufvoid =3D 99614720
2011-08-10 15:24:53,216 INFO org.apache.hadoop.mapred.MapTask: kvstart =3D=
 65533; kvend =3D 327677; length =3D 327680
2011-08-10 15:24:53,660 INFO org.apache.hadoop.mapred.MapTask: Finished =
spill 4
2011-08-10 15:24:54,010 INFO org.apache.hadoop.mapred.MapTask: Spilling =
map output: record full =3D true
2011-08-10 15:24:54,010 INFO org.apache.hadoop.mapred.MapTask: bufstart =
=3D 23592906; bufend =3D 28311480; bufvoid =3D 99614720
2011-08-10 15:24:54,010 INFO org.apache.hadoop.mapred.MapTask: kvstart =3D=
 327677; kvend =3D 262140; length =3D 327680
2011-08-10 15:24:54,447 INFO org.apache.hadoop.mapred.MapTask: Finished =
spill 5
2011-08-10 15:24:54,793 INFO org.apache.hadoop.mapred.MapTask: Spilling =
map output: record full =3D true
2011-08-10 15:24:54,793 INFO org.apache.hadoop.mapred.MapTask: bufstart =
=3D 28311480; bufend =3D 33030054; bufvoid =3D 99614720
2011-08-10 15:24:54,793 INFO org.apache.hadoop.mapred.MapTask: kvstart =3D=
 262140; kvend =3D 196603; length =3D 327680
2011-08-10 15:24:55,237 INFO org.apache.hadoop.mapred.MapTask: Finished =
spill 6
2011-08-10 15:24:55,564 INFO org.apache.hadoop.mapred.MapTask: Spilling =
map output: record full =3D true
2011-08-10 15:24:55,564 INFO org.apache.hadoop.mapred.MapTask: bufstart =
=3D 33030054; bufend =3D 37748628; bufvoid =3D 99614720
2011-08-10 15:24:55,564 INFO org.apache.hadoop.mapred.MapTask: kvstart =3D=
 196603; kvend =3D 131066; length =3D 327680
2011-08-10 15:24:55,981 INFO org.apache.hadoop.mapred.MapTask: Finished =
spill 7
2011-08-10 15:24:56,434 INFO org.apache.hadoop.mapred.MapTask: Spilling =
map output: record full =3D true
2011-08-10 15:24:56,434 INFO org.apache.hadoop.mapred.MapTask: bufstart =
=3D 37748628; bufend =3D 42467202; bufvoid =3D 99614720
2011-08-10 15:24:56,434 INFO org.apache.hadoop.mapred.MapTask: kvstart =3D=
 131066; kvend =3D 65529; length =3D 327680
2011-08-10 15:24:56,848 INFO org.apache.hadoop.mapred.MapTask: Finished =
spill 8
2011-08-10 15:24:57,051 INFO org.apache.hadoop.mapred.MapTask: Starting =
flush of map output
2011-08-10 15:24:57,282 INFO org.apache.hadoop.mapred.MapTask: Finished =
spill 9
2011-08-10 15:24:57,291 INFO org.apache.hadoop.mapred.Merger: Merging 10 =
sorted segments
2011-08-10 15:24:57,297 INFO org.apache.hadoop.mapred.Merger: Down to =
the last merge-pass, with 10 segments left of total size: 50698660 bytes
2011-08-10 15:24:59,552 INFO org.apache.hadoop.mapred.TaskRunner: =
Task:attempt_201108051329_0060_m_000000_0 is done. And is in the process =
of commiting
2011-08-10 15:24:59,555 INFO org.apache.hadoop.mapred.TaskRunner: Task =
'attempt_201108051329_0060_m_000000_0' done.
</span><div><span class=3D"Apple-style-span" style=3D"font-family: =
monospace; white-space: pre; font-size: medium; =
"><br></span></div><div><span class=3D"Apple-style-span" =
style=3D"font-family: monospace; white-space: pre; font-size: medium; =
">and the log for the reducer</span></div>
<div><span class=3D"Apple-style-span" style=3D"font-family: monospace; =
white-space: pre; font-size: medium; "><br></span></div><div><font =
class=3D"Apple-style-span" face=3D"monospace" size=3D"3"><span =
class=3D"Apple-style-span" style=3D"white-space: pre;">2011-08-10 =
15:25:00,835 INFO org.apache.hadoop.metrics.jvm.JvmMetrics: Initializing =
JVM Metrics with processName=3DSHUFFLE, sessionId=3D
2011-08-10 15:25:01,005 INFO org.apache.hadoop.mapred.ReduceTask: =
ShuffleRamManager: MemoryLimit=3D140699232, =
MaxSingleShuffleLimit=3D35174808
2011-08-10 15:25:01,022 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Thread started: Thread for merging =
on-disk files
2011-08-10 15:25:01,022 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Thread started: Thread for merging =
in memory files
2011-08-10 15:25:01,022 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Thread waiting: Thread for merging =
on-disk files
2011-08-10 15:25:01,024 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Need another 1 map output(s) where =
0 is already in progress
2011-08-10 15:25:01,024 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Thread started: Thread for polling =
Map Completion Events
2011-08-10 15:25:01,037 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Scheduled 0 outputs (0 slow hosts =
and0 dup hosts)
2011-08-10 15:25:01,038 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0: Got 1 new map-outputs
2011-08-10 15:25:06,039 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Scheduled 1 outputs (0 slow hosts =
and0 dup hosts)
2011-08-10 15:25:06,121 INFO org.apache.hadoop.mapred.ReduceTask: =
header: attempt_201108051329_0060_m_000000_0, compressed len: 50698646, =
decompressed len: 50698642
2011-08-10 15:25:06,121 INFO org.apache.hadoop.mapred.ReduceTask: =
Shuffling 50698642 bytes (50698646 raw bytes) into Local-FS from =
attempt_201108051329_0060_m_000000_0
2011-08-10 15:25:06,314 INFO org.apache.hadoop.mapred.ReduceTask: Read =
50698646 bytes from map-output for attempt_201108051329_0060_m_000000_0
2011-08-10 15:25:06,315 INFO org.apache.hadoop.mapred.ReduceTask: =
attempt_201108051329_0060_r_000000_0 Thread waiting: Thread for merging =
on-disk files
2011-08-10 15:25:07,055 INFO org.apache.hadoop.mapred.ReduceTask: =
GetMapEventsThread exiting
2011-08-10 15:25:07,055 INFO org.apache.hadoop.mapred.ReduceTask: =
getMapsEventsThread joined.
2011-08-10 15:25:07,056 INFO org.apache.hadoop.mapred.ReduceTask: Closed =
ram manager
2011-08-10 15:25:07,056 INFO org.apache.hadoop.mapred.ReduceTask: =
Interleaved on-disk merge complete: 1 files left.
2011-08-10 15:25:07,056 INFO org.apache.hadoop.mapred.ReduceTask: =
In-memory merge complete: 0 files left.
2011-08-10 15:25:07,061 INFO org.apache.hadoop.mapred.ReduceTask: =
Merging 1 files, 50698646 bytes from disk
2011-08-10 15:25:07,062 INFO org.apache.hadoop.mapred.ReduceTask: =
Merging 0 segments, 0 bytes from memory into reduce
2011-08-10 15:25:07,065 INFO org.apache.hadoop.mapred.Merger: Merging 1 =
sorted segments
2011-08-10 15:25:07,072 INFO org.apache.hadoop.mapred.Merger: Down to =
the last merge-pass, with 1 segments left of total size: 50698642 bytes
2011-08-10 15:25:30,126 INFO org.apache.hadoop.mapred.TaskRunner: =
Task:attempt_201108051329_0060_r_000000_0 is done. And is in the process =
of commiting
2011-08-10 15:25:30,129 INFO org.apache.hadoop.mapred.TaskRunner: Task =
'attempt_201108051329_0060_r_000000_0' done.</span></font><span =
class=3D"Apple-style-span" style=3D"font-family: monospace; white-space: =
pre; font-size: medium; ">
</span></div><div><span class=3D"Apple-style-span" style=3D"font-family: =
monospace; white-space: pre; font-size: medium; =
"><br></span></div><div><font class=3D"Apple-style-span" =
face=3D"monospace" size=3D"3"><span class=3D"Apple-style-span" =
style=3D"white-space: pre;">My code is similar to the word count =
example:</span></font></div>
<div><font class=3D"Apple-style-span" face=3D"monospace" size=3D"3"><span =
class=3D"Apple-style-span" style=3D"white-space: =
pre;"><br></span></font></div><div><font class=3D"Apple-style-span" =
face=3D"monospace" size=3D"3"><span class=3D"Apple-style-span" =
style=3D"white-space: pre;">&nbsp; &nbsp; public int run(String[] args) =
throws Exception {</span></font></div>
<div><font class=3D"Apple-style-span" face=3D"monospace" size=3D"3"><span =
class=3D"Apple-style-span" style=3D"white-space: pre;">        =
...</span></font></div><div><font class=3D"Apple-style-span" =
face=3D"monospace" size=3D"3"><div style=3D"white-space: pre; ">
&nbsp; &nbsp; &nbsp; &nbsp; getConf().set(CONF_COLUMN_NAME, =
columnName);</div><div style=3D"white-space: pre; =
"><br></div></font></div><div><font class=3D"Apple-style-span" =
face=3D"monospace" size=3D"3"><div><span class=3D"Apple-style-span" =
style=3D"white-space: pre; ">&nbsp; &nbsp; &nbsp; &nbsp; Job job4 =3D =
new Job(getConf(), "SalesRankWriter");</span></div>
<div><span class=3D"Apple-style-span" style=3D"white-space: pre;">&nbsp; =
&nbsp; &nbsp; &nbsp; =
job4.setJarByClass(SalesRankLoader.class);</span></div><div><span =
class=3D"Apple-style-span" style=3D"white-space: pre;">&nbsp; &nbsp; =
&nbsp; &nbsp; job4.setMapperClass(RankUpdateMapper.class);</span></div>
<div><span class=3D"Apple-style-span" style=3D"white-space: pre;">&nbsp; =
&nbsp; &nbsp; &nbsp; =
job4.setReducerClass(RankUpdateReducer.class);</span></div><div><span =
class=3D"Apple-style-span" style=3D"white-space: pre;">&nbsp; &nbsp; =
&nbsp; &nbsp; job4.setMapOutputKeyClass(Text.class);</span></div>
<div><span class=3D"Apple-style-span" style=3D"white-space: pre;">&nbsp; =
&nbsp; &nbsp; &nbsp; =
job4.setMapOutputValueClass(IntWritable.class);</span></div><div><span =
class=3D"Apple-style-span" style=3D"white-space: pre;">&nbsp; &nbsp; =
&nbsp; &nbsp; job4.setOutputKeyClass(ByteBuffer.class);</span></div>
<div><span class=3D"Apple-style-span" style=3D"white-space: pre;">&nbsp; =
&nbsp; &nbsp; &nbsp; =
job4.setOutputValueClass(List.class);</span></div><div><span =
class=3D"Apple-style-span" style=3D"white-space: pre;">&nbsp; &nbsp; =
&nbsp; &nbsp; =
job4.setOutputFormatClass(ColumnFamilyOutputFormat.class);</span></div>
<div><span class=3D"Apple-style-span" style=3D"white-space: pre;">&nbsp; =
&nbsp; &nbsp; &nbsp; =
job4.setInputFormatClass(TextInputFormat.class);</span></div><div><span =
class=3D"Apple-style-span" style=3D"white-space: pre;">&nbsp; &nbsp; =
&nbsp; &nbsp; FileInputFormat.addInputPath(job4, new =
Path(prePath));</span></div>
<div><span class=3D"Apple-style-span" style=3D"white-space: =
pre;"><br></span></div><div><span class=3D"Apple-style-span" =
style=3D"white-space: pre;">&nbsp; &nbsp; &nbsp; &nbsp; =
ConfigHelper.setOutputColumnFamily(job4.getConfiguration(), KEYSPACE, =
columnFamily);</span></div>
<div><span class=3D"Apple-style-span" style=3D"white-space: pre;">&nbsp; =
&nbsp; &nbsp; &nbsp; ConfigHelper.setRpcPort(job4.getConfiguration(), =
"9260");</span></div><div><span class=3D"Apple-style-span" =
style=3D"white-space: pre;">&nbsp; &nbsp; &nbsp; &nbsp; =
ConfigHelper.setInitialAddress(job4.getConfiguration(), =
"dnjsrcha01");</span></div>
<div><span class=3D"Apple-style-span" style=3D"white-space: pre;">&nbsp; =
&nbsp; &nbsp; &nbsp; =
ConfigHelper.setPartitioner(job4.getConfiguration(), =
"org.apache.cassandra.dht.RandomPartitioner");</span></div><div><span =
class=3D"Apple-style-span" style=3D"white-space: pre;"><br>
</span></div><div><span class=3D"Apple-style-span" style=3D"white-space: =
pre;">&nbsp; &nbsp; &nbsp; &nbsp; =
job4.waitForCompletion(true);</span></div><div style=3D"white-space: =
pre; ">        ...</div><div style=3D"white-space: pre; ">    =
}</div><div style=3D"white-space: pre; ">
<br></div><div style=3D"white-space: pre; ">where the mapper and reducer =
are defined as:</div><div style=3D"white-space: pre; =
"><br></div><div><span class=3D"Apple-style-span" style=3D"white-space: =
pre;">    public static class RankUpdateMapper extends =
Mapper&lt;LongWritable, Text, Text, IntWritable&gt; {
        public void map(LongWritable key, Text value, Context context) =
throws IOException, InterruptedException {
            String line =3D value.toString();
            StringTokenizer tokenizer =3D new StringTokenizer(line);
            String ean =3D tokenizer.nextToken();
            int rank =3D Integer.parseInt(tokenizer.nextToken());

            context.write(new Text(ean), new IntWritable(rank));
        }
    }

    public static class RankUpdateReducer extends Reducer&lt;Text, =
IntWritable, ByteBuffer, List&lt;Mutation&gt;&gt;
    {
        private ByteBuffer outputKey;

        protected void setup(org.apache.hadoop.mapreduce.Reducer.Context =
context) throws IOException, InterruptedException
        {
            outputKey =3D =
ByteBufferUtil.bytes(context.getConfiguration().get(CONF_COLUMN_NAME));
        }

        public void reduce(Text key, Iterable&lt;IntWritable&gt; values, =
Context context) throws IOException, InterruptedException
        {
            context.write(outputKey, =
Collections.singletonList(getMutation(key, =
values.iterator().next().get())));
        }

        private static Mutation getMutation(Text key, int value)
        {
            Column c =3D new Column();
            c.setName(ByteBuffer.wrap(Arrays.copyOf(key.getBytes(), =
key.getLength())));
            c.setValue(ByteBufferUtil.bytes(String.valueOf(value)));
            c.setTimestamp(System.currentTimeMillis() * 1000);

            Mutation m =3D new Mutation();
            m.setColumn_or_supercolumn(new ColumnOrSuperColumn());
            m.column_or_supercolumn.setColumn(c);
            return m;
        }
    }</span><span class=3D"Apple-style-span" style=3D"white-space: pre; =
">
</span></div><div><br></div><div>Any thing wrong =
here?</div><div><br></div><div>Thanks,</div><div><br></div><div>John</div>=
</font></div>
</blockquote></div><br></div></body></html>=

--Apple-Mail=_595EBDDA-4BD5-491C-B45D-86254C69A7F0--