Mailing-List: contact user-help@hadoop.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@hadoop.apache.org
Received-SPF: pass (athena.apache.org: message received from 54.164.171.186
 which is an MX secondary for user@hadoop.apache.org)
MIME-Version: 1.0
In-Reply-To: 
 <CA+8RE+vUD8qcXpPaPHDUZLmfuhAcSOCGf1Vu_cbs_7UVFcKk=Q@mail.gmail.com>
References: <422C3552-2674-4958-85E5-32AFE975ED41@usc.edu>
	<CAEo-6+Q7s4b1DFaOAzeU-0Ctqx1gVmdpfsERD6rHiioUKWtYcA@mail.gmail.com>
	<CA+8RE+vUD8qcXpPaPHDUZLmfuhAcSOCGf1Vu_cbs_7UVFcKk=Q@mail.gmail.com>
Date: Sun, 3 May 2015 01:45:49 +0530
Message-ID: 
 <CALS4w5cc2=3bGJNa0XeAyFSAtCkJjcR_EzN2qUR0Ld3MmX5NsQ@mail.gmail.com>
Subject: Re: Json Parsing in map reduce.
From: Sandeep Khurana <skhurana333@gmail.com>
To: user@hadoop.apache.org
Content-Type: multipart/alternative; boundary=047d7bd6be22b5e3e305151efe30

--047d7bd6be22b5e3e305151efe30
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: quoted-printable

This code won't work if the json spans more than one line in the input
files.
On May 3, 2015 1:41 AM, "Shambhavi Punja" <spunja@usc.edu> wrote:

> Hi Shahab,
>
> Thanks. That helped.
>
> Regards,
> Shambhavi
>
> On Thu, Apr 30, 2015 at 10:18 AM, Shahab Yunus <shahab.yunus@gmail.com>
> wrote:
>
>> The reason is that the Json parsing code is in a 3rd party library which
>> is not included in the default  map reduce/hadoop distribution. You have=
 to
>> add them in your classpath at *runtime*. There are multiple ways to do
>> it (which also depends upon how you plan to run and package/deploy your
>> code.)
>>
>> Check out this:
>>
>> https://hadoopi.wordpress.com/2014/06/05/hadoop-add-third-party-librarie=
s-to-mapreduce-job/
>>
>> http://blog.cloudera.com/blog/2011/01/how-to-include-third-party-librari=
es-in-your-map-reduce-job/
>>
>> Regards,
>> Shahab
>>
>> On Thu, Apr 30, 2015 at 1:01 PM, Shambhavi Punja <spunja@usc.edu> wrote:
>>
>>> Hi,
>>>
>>> I am working on an assignment on Hadoop Map reduce. I am very new to Ma=
p
>>> Reduce.
>>>
>>> The assignment has many sections but for now I am trying to parse JSON
>>> data.
>>>
>>> The input(i.e. value) to the map function is a single record of the for=
m
>>>    xyz, {'abc=E2=80=99:=E2=80=99pqr1=E2=80=99,'abc2=E2=80=99:'pq1, pq2=
=E2=80=99}, {=E2=80=98key=E2=80=99:'value1=E2=80=99}
>>> I am interested only in the getting the frequency of value1.
>>>
>>> Following is the map- reduce job.
>>>
>>> public static class Map extends MapReduceBase implements
>>> Mapper<LongWritable, Text, Text, IntWritable> {
>>>               private final static IntWritable one =3D new IntWritable(=
1);
>>>               private Text word =3D new Text();
>>>
>>>
>>>               public void map(LongWritable key, Text value,
>>> OutputCollector<Text, IntWritable> output, Reporter reporter) throws
>>> IOException {
>>>                       String line =3D value.toString();
>>>                       String[] tuple =3D line.split("(?<=3D\\}),\\s");
>>>                       try{
>>>                       JSONObject obj =3D new JSONObject(tuple[1]);
>>>                       String id =3D obj.getString(=E2=80=9Ckey");
>>>                           word.set(id);
>>>                           output.collect(word, one);
>>>                       }
>>>                       catch(JSONException e){
>>>                           e.printStackTrace();
>>>                       }
>>>                   }
>>>             }
>>>
>>>
>>>
>>>
>>>         public static class Reduce extends MapReduceBase implements
>>> Reducer<Text, IntWritable, Text, IntWritable> {
>>>               public void reduce(Text key, Iterator<IntWritable>
>>> values, OutputCollector<Text, IntWritable> output, Reporter reporter)
>>> throws IOException {
>>>                     int sum =3D 0;
>>>                     while (values.hasNext()) {
>>>                           sum +=3D values.next().get();
>>>                         }
>>>                     output.collect(key, new IntWritable(sum));
>>>                   }
>>>             }
>>>
>>> I successfully compiled the java code using the json and hadoop jars.
>>> Created a jar. But wen I run the Hadoop command I am getting the follow=
ing
>>> exceptions.
>>>
>>>
>>> 15/04/30 00:36:49 WARN util.NativeCodeLoader: Unable to load
>>> native-hadoop library for your platform... using builtin-java classes w=
here
>>> applicable
>>> 15/04/30 00:36:49 WARN mapred.JobClient: Use GenericOptionsParser for
>>> parsing the arguments. Applications should implement Tool for the same.
>>> 15/04/30 00:36:49 WARN snappy.LoadSnappy: Snappy native library not
>>> loaded
>>> 15/04/30 00:36:49 INFO mapred.FileInputFormat: Total input paths to
>>> process : 1
>>> 15/04/30 00:36:49 INFO mapred.JobClient: Running job:
>>> job_local1121514690_0001
>>> 15/04/30 00:36:49 INFO mapred.LocalJobRunner: Waiting for map tasks
>>> 15/04/30 00:36:49 INFO mapred.LocalJobRunner: Starting task:
>>> attempt_local1121514690_0001_m_000000_0
>>> 15/04/30 00:36:49 INFO mapred.Task:  Using ResourceCalculatorPlugin :
>>> null
>>> 15/04/30 00:36:49 INFO mapred.MapTask: Processing split:
>>> file:/Users/Shamvi/gumgum/jars/input/ab1.txt:0+305
>>> 15/04/30 00:36:49 INFO mapred.MapTask: numReduceTasks: 1
>>> 15/04/30 00:36:49 INFO mapred.MapTask: io.sort.mb =3D 100
>>> 15/04/30 00:36:49 INFO mapred.MapTask: data buffer =3D 79691776/9961472=
0
>>> 15/04/30 00:36:49 INFO mapred.MapTask: record buffer =3D 262144/327680
>>> 15/04/30 00:36:49 INFO mapred.LocalJobRunner: Map task executor complet=
e.
>>> 15/04/30 00:36:49 WARN mapred.LocalJobRunner: job_local1121514690_0001
>>> java.lang.Exception: java.lang.RuntimeException: Error in configuring
>>> object
>>> at
>>> org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:354=
)
>>> Caused by: java.lang.RuntimeException: Error in configuring object
>>> at
>>> org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:=
93)
>>> at
>>> org.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:64)
>>> at
>>> org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java=
:117)
>>> at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:426)
>>> at org.apache.hadoop.mapred.MapTask.run(MapTask.java:366)
>>> at
>>> org.apache.hadoop.mapred.LocalJobRunner$Job$MapTaskRunnable.run(LocalJo=
bRunner.java:223)
>>> at
>>> java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
>>> at java.util.concurrent.FutureTask.run(FutureTask.java:266)
>>> at
>>> java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.ja=
va:1142)
>>> at
>>> java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.j=
ava:617)
>>> at java.lang.Thread.run(Thread.java:745)
>>> Caused by: java.lang.reflect.InvocationTargetException
>>> at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
>>> at
>>> sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.ja=
va:62)
>>> at
>>> sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccesso=
rImpl.java:43)
>>> at java.lang.reflect.Method.invoke(Method.java:483)
>>> at
>>> org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:=
88)
>>> ... 10 more
>>> Caused by: java.lang.NoClassDefFoundError: org/json/JSONException
>>> at java.lang.Class.forName0(Native Method)
>>> at java.lang.Class.forName(Class.java:344)
>>> at
>>> org.apache.hadoop.conf.Configuration.getClassByName(Configuration.java:=
810)
>>> at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:855=
)
>>> at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:881=
)
>>> at org.apache.hadoop.mapred.JobConf.getMapperClass(JobConf.java:968)
>>> at org.apache.hadoop.mapred.MapRunner.configure(MapRunner.java:34)
>>> ... 15 more
>>> Caused by: java.lang.ClassNotFoundException: org.json.JSONException
>>> at java.net.URLClassLoader$1.run(URLClassLoader.java:372)
>>> at java.net.URLClassLoader$1.run(URLClassLoader.java:361)
>>> at java.security.AccessController.doPrivileged(Native Method)
>>> at java.net.URLClassLoader.findClass(URLClassLoader.java:360)
>>> at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
>>> at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
>>> ... 22 more
>>> 15/04/30 00:36:50 INFO mapred.JobClient:  map 0% reduce 0%
>>> 15/04/30 00:36:50 INFO mapred.JobClient: Job complete:
>>> job_local1121514690_0001
>>> 15/04/30 00:36:50 INFO mapred.JobClient: Counters: 0
>>> 15/04/30 00:36:50 INFO mapred.JobClient: Job Failed: NA
>>> Exception in thread "main" java.io.IOException: Job failed!
>>> at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1357)
>>> at org.myorg.Wordcount.main(Wordcount.java:64)
>>> at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
>>> at
>>> sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.ja=
va:62)
>>> at
>>> sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccesso=
rImpl.java:43)
>>> at java.lang.reflect.Method.invoke(Method.java:483)
>>> at org.apache.hadoop.util.RunJar.main(RunJar.java:160)
>>>
>>>
>>> PS: When I modify the same code and exclude the JSON parsing i.e. find
>>> frequency of {=E2=80=98key=E2=80=99:=E2=80=99value1=E2=80=99} section o=
f the example input, all works well.
>>>
>>>
>>
>

--047d7bd6be22b5e3e305151efe30
Content-Type: text/html; charset=UTF-8
Content-Transfer-Encoding: quoted-printable

<p dir=3D"ltr">This code won&#39;t work if the json spans more than one lin=
e in the input files. </p>
<div class=3D"gmail_quote">On May 3, 2015 1:41 AM, &quot;Shambhavi Punja&qu=
ot; &lt;<a href=3D"mailto:spunja@usc.edu">spunja@usc.edu</a>&gt; wrote:<br =
type=3D"attribution"><blockquote class=3D"gmail_quote" style=3D"margin:0 0 =
0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir=3D"ltr">Hi Sha=
hab,<div><br></div><div>Thanks. That helped.</div><div><br></div><div>Regar=
ds,</div><div>Shambhavi</div></div><div class=3D"gmail_extra"><br><div clas=
s=3D"gmail_quote">On Thu, Apr 30, 2015 at 10:18 AM, Shahab Yunus <span dir=
=3D"ltr">&lt;<a href=3D"mailto:shahab.yunus@gmail.com" target=3D"_blank">sh=
ahab.yunus@gmail.com</a>&gt;</span> wrote:<br><blockquote class=3D"gmail_qu=
ote" style=3D"margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex=
"><div dir=3D"ltr">The reason is that the Json parsing code is in a 3rd par=
ty library which is not included in the default =C2=A0map reduce/hadoop dis=
tribution. You have to add them in your classpath at <b>runtime</b>. There =
are multiple ways to do it (which also depends upon how you plan to run and=
 package/deploy your code.)<div><br></div><div>Check out this:</div><div><a=
 href=3D"https://hadoopi.wordpress.com/2014/06/05/hadoop-add-third-party-li=
braries-to-mapreduce-job/" target=3D"_blank">https://hadoopi.wordpress.com/=
2014/06/05/hadoop-add-third-party-libraries-to-mapreduce-job/</a><br></div>=
<div><a href=3D"http://blog.cloudera.com/blog/2011/01/how-to-include-third-=
party-libraries-in-your-map-reduce-job/" target=3D"_blank">http://blog.clou=
dera.com/blog/2011/01/how-to-include-third-party-libraries-in-your-map-redu=
ce-job/</a><br></div><div><br></div><div>Regards,</div><div>Shahab</div></d=
iv><div><div><div class=3D"gmail_extra"><br><div class=3D"gmail_quote">On T=
hu, Apr 30, 2015 at 1:01 PM, Shambhavi Punja <span dir=3D"ltr">&lt;<a href=
=3D"mailto:spunja@usc.edu" target=3D"_blank">spunja@usc.edu</a>&gt;</span> =
wrote:<br><blockquote class=3D"gmail_quote" style=3D"margin:0 0 0 .8ex;bord=
er-left:1px #ccc solid;padding-left:1ex"><div style=3D"word-wrap:break-word=
">Hi,<div><br></div><div>I am working on an assignment on Hadoop Map reduce=
. I am very new to Map Reduce.</div><div><br></div><div>The assignment has =
many sections but for now I am trying to parse JSON data.</div><div><br></d=
iv><div>The input(i.e. value) to the map function is a single record of the=
 form =C2=A0 =C2=A0xyz, {&#39;abc=E2=80=99:=E2=80=99pqr1=E2=80=99,&#39;abc2=
=E2=80=99:&#39;pq1, pq2=E2=80=99}, {=E2=80=98key=E2=80=99:&#39;value1=E2=80=
=99}</div><div>I am interested only in the getting the frequency of value1.=
</div><div><br></div><div>Following is the map- reduce job.</div><div><br><=
/div><div><div style=3D"margin:0px;font-size:11px;font-family:Menlo"><span =
style=3D"color:#bb2ca2">public</span> <span style=3D"color:#bb2ca2">static<=
/span> <span style=3D"color:#bb2ca2">class</span> Map <span style=3D"color:=
#bb2ca2">extends</span> MapReduceBase <span style=3D"color:#bb2ca2">impleme=
nts</span> Mapper&lt;LongWritable, Text, Text, IntWritable&gt; {</div><div =
style=3D"margin:0px;font-size:11px;font-family:Menlo">=C2=A0 =C2=A0 =C2=A0 =
=C2=A0 <span style=3D"white-space:pre-wrap">	</span>=C2=A0 =C2=A0 =C2=A0 <s=
pan style=3D"color:#bb2ca2">private</span> <span style=3D"color:#bb2ca2">fi=
nal</span> <span style=3D"color:#bb2ca2">static</span> IntWritable one =3D =
<span style=3D"color:#bb2ca2">new</span> IntWritable(<span style=3D"color:#=
272ad8">1</span>);</div><div style=3D"margin:0px;font-size:11px;font-family=
:Menlo">=C2=A0 =C2=A0 =C2=A0 =C2=A0 <span style=3D"white-space:pre-wrap">	<=
/span>=C2=A0 =C2=A0 =C2=A0 <span style=3D"color:#bb2ca2">private</span> Tex=
t word =3D <span style=3D"color:#bb2ca2">new</span> Text();</div><p style=
=3D"margin:0px;font-size:11px;font-family:Menlo;min-height:13px">=C2=A0=C2=
=A0 =C2=A0 =C2=A0 =C2=A0<br></p><div style=3D"margin:0px;font-size:11px;fon=
t-family:Menlo">=C2=A0 =C2=A0 =C2=A0 =C2=A0 <span style=3D"white-space:pre-=
wrap">	</span>=C2=A0 =C2=A0 =C2=A0 <span style=3D"color:#bb2ca2">public</sp=
an> <span style=3D"color:#bb2ca2">void</span> map(LongWritable key, Text va=
lue, OutputCollector&lt;Text, IntWritable&gt; output, Reporter reporter) <s=
pan style=3D"color:#bb2ca2">throws</span> IOException {</div><div style=3D"=
margin:0px;font-size:11px;font-family:Menlo">=C2=A0 =C2=A0 =C2=A0 =C2=A0 =
=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 String line =3D value.toSt=
ring();</div><div style=3D"margin:0px;font-size:11px;font-family:Menlo">=C2=
=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 S=
tring[] tuple =3D line.split(<span style=3D"color:#d12f1b">&quot;(?&lt;=3D\=
\}),<a>\\s</a>&quot;</span>);</div><div style=3D"margin:0px;font-size:11px;=
font-family:Menlo">=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =
=C2=A0 =C2=A0 =C2=A0 <span style=3D"color:#bb2ca2">try</span>{</div><div st=
yle=3D"margin:0px;font-size:11px;font-family:Menlo">=C2=A0 =C2=A0 =C2=A0 =
=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 JSONObject obj =3D =
<span style=3D"color:#bb2ca2">new</span> JSONObject(tuple[<span style=3D"co=
lor:#272ad8">1</span>]);</div><div style=3D"margin:0px"><font face=3D"Menlo=
"><span style=3D"font-size:11px">=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =
=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 String id =3D obj.getString(</span></fon=
t><font color=3D"#d12f1b" face=3D"Menlo"><span style=3D"font-size:11px">=E2=
=80=9Ckey&quot;</span></font><font face=3D"Menlo"><span style=3D"font-size:=
11px">);</span></font></div><div style=3D"margin:0px;font-size:11px;font-fa=
mily:Menlo">=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =
=C2=A0 =C2=A0 =C2=A0 =C2=A0 word.set(id);</div><div style=3D"margin:0px;fon=
t-size:11px;font-family:Menlo">=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =
=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 output.collect(word, one);=
</div><div style=3D"margin:0px;font-size:11px;font-family:Menlo">=C2=A0 =C2=
=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 }</div><=
div style=3D"margin:0px;font-size:11px;font-family:Menlo">=C2=A0 =C2=A0 =C2=
=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 <span style=3D"=
color:#bb2ca2">catch</span>(JSONException e){</div><div style=3D"margin:0px=
;font-size:11px;font-family:Menlo">=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=
=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 e.printStackTrace();</=
div><div style=3D"margin:0px;font-size:11px;font-family:Menlo">=C2=A0 =C2=
=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 }</div><=
div style=3D"margin:0px;font-size:11px;font-family:Menlo">=C2=A0 =C2=A0 =C2=
=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 }</div><div style=3D"margin:0=
px;font-size:11px;font-family:Menlo">=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=
=A0 }</div><p style=3D"margin:0px;font-size:11px;font-family:Menlo;min-heig=
ht:13px">=C2=A0=C2=A0 =C2=A0 =C2=A0 =C2=A0<br></p><p style=3D"margin:0px;fo=
nt-size:11px;font-family:Menlo;min-height:13px">=C2=A0=C2=A0 =C2=A0<br></p>=
<div style=3D"margin:0px;font-size:11px;font-family:Menlo">=C2=A0 =C2=A0 <s=
pan style=3D"white-space:pre-wrap">	</span>=C2=A0 =C2=A0 <span style=3D"col=
or:#bb2ca2">public</span> <span style=3D"color:#bb2ca2">static</span> <span=
 style=3D"color:#bb2ca2">class</span> Reduce <span style=3D"color:#bb2ca2">=
extends</span> MapReduceBase <span style=3D"color:#bb2ca2">implements</span=
> Reducer&lt;Text, IntWritable, Text, IntWritable&gt; {</div><div style=3D"=
margin:0px;font-size:11px;font-family:Menlo">=C2=A0 =C2=A0 =C2=A0 =C2=A0 <s=
pan style=3D"white-space:pre-wrap">	</span>=C2=A0 =C2=A0 =C2=A0 <span style=
=3D"color:#bb2ca2">public</span> <span style=3D"color:#bb2ca2">void</span> =
reduce(Text key, Iterator&lt;IntWritable&gt; values, OutputCollector&lt;Tex=
t, IntWritable&gt; output, Reporter reporter) <span style=3D"color:#bb2ca2"=
>throws</span> IOException {</div><div style=3D"margin:0px;font-size:11px;f=
ont-family:Menlo">=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 <span style=3D"=
white-space:pre-wrap">	</span>=C2=A0 =C2=A0 =C2=A0 =C2=A0 <span style=3D"co=
lor:#bb2ca2">int</span> sum =3D <span style=3D"color:#272ad8">0</span>;</di=
v><div style=3D"margin:0px;font-size:11px;font-family:Menlo">=C2=A0 =C2=A0 =
=C2=A0 =C2=A0 =C2=A0 =C2=A0 <span style=3D"white-space:pre-wrap">	</span>=
=C2=A0 =C2=A0 =C2=A0 =C2=A0 <span style=3D"color:#bb2ca2">while</span> (val=
ues.hasNext()) {</div><div style=3D"margin:0px;font-size:11px;font-family:M=
enlo">=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 <span style=
=3D"white-space:pre-wrap">	</span>=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 sum +=
=3D values.next().get();</div><div style=3D"margin:0px;font-size:11px;font-=
family:Menlo">=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 <span=
 style=3D"white-space:pre-wrap">	</span>=C2=A0 =C2=A0 =C2=A0 =C2=A0 }</div>=
<div style=3D"margin:0px;font-size:11px;font-family:Menlo">=C2=A0 =C2=A0 =
=C2=A0 =C2=A0 =C2=A0 =C2=A0 <span style=3D"white-space:pre-wrap">	</span>=
=C2=A0 =C2=A0 =C2=A0 =C2=A0 output.collect(key, <span style=3D"color:#bb2ca=
2">new</span> IntWritable(sum));</div><div style=3D"margin:0px;font-size:11=
px;font-family:Menlo">=C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 =C2=A0 <span style=
=3D"white-space:pre-wrap">	</span>=C2=A0 =C2=A0 =C2=A0 }</div><div style=3D=
"margin:0px;font-size:11px;font-family:Menlo">=C2=A0 =C2=A0 =C2=A0 =C2=A0 <=
span style=3D"white-space:pre-wrap">	</span>=C2=A0 =C2=A0 }</div></div><div=
><br></div><div>I successfully compiled the java code using the json and ha=
doop jars. Created a jar. But wen I run the Hadoop command I am getting the=
 following exceptions.</div><div><br></div><div><br></div><div><div style=
=3D"margin:0px;font-size:11px;font-family:Menlo">15/04/30 00:36:49 WARN uti=
l.NativeCodeLoader: Unable to load native-hadoop library for your platform.=
.. using builtin-java classes where applicable</div><div style=3D"margin:0p=
x;font-size:11px;font-family:Menlo">15/04/30 00:36:49 WARN mapred.JobClient=
: Use GenericOptionsParser for parsing the arguments. Applications should i=
mplement Tool for the same.</div><div style=3D"margin:0px;font-size:11px;fo=
nt-family:Menlo">15/04/30 00:36:49 WARN snappy.LoadSnappy: Snappy native li=
brary not loaded</div><div style=3D"margin:0px;font-size:11px;font-family:M=
enlo">15/04/30 00:36:49 INFO mapred.FileInputFormat: Total input paths to p=
rocess : 1</div><div style=3D"margin:0px;font-size:11px;font-family:Menlo">=
15/04/30 00:36:49 INFO mapred.JobClient: Running job: job_local1121514690_0=
001</div><div style=3D"margin:0px;font-size:11px;font-family:Menlo">15/04/3=
0 00:36:49 INFO mapred.LocalJobRunner: Waiting for map tasks</div><div styl=
e=3D"margin:0px;font-size:11px;font-family:Menlo">15/04/30 00:36:49 INFO ma=
pred.LocalJobRunner: Starting task: attempt_local1121514690_0001_m_000000_0=
</div><div style=3D"margin:0px;font-size:11px;font-family:Menlo">15/04/30 0=
0:36:49 INFO mapred.Task:=C2=A0 Using ResourceCalculatorPlugin : null</div>=
<div style=3D"margin:0px;font-size:11px;font-family:Menlo">15/04/30 00:36:4=
9 INFO mapred.MapTask: Processing split: file:/Users/Shamvi/gumgum/jars/inp=
ut/ab1.txt:0+305</div><div style=3D"margin:0px;font-size:11px;font-family:M=
enlo">15/04/30 00:36:49 INFO mapred.MapTask: numReduceTasks: 1</div><div st=
yle=3D"margin:0px;font-size:11px;font-family:Menlo">15/04/30 00:36:49 INFO =
mapred.MapTask: io.sort.mb =3D 100</div><div style=3D"margin:0px;font-size:=
11px;font-family:Menlo">15/04/30 00:36:49 INFO mapred.MapTask: data buffer =
=3D 79691776/99614720</div><div style=3D"margin:0px;font-size:11px;font-fam=
ily:Menlo">15/04/30 00:36:49 INFO mapred.MapTask: record buffer =3D 262144/=
327680</div><div style=3D"margin:0px;font-size:11px;font-family:Menlo">15/0=
4/30 00:36:49 INFO mapred.LocalJobRunner: Map task executor complete.</div>=
<div style=3D"margin:0px;font-size:11px;font-family:Menlo">15/04/30 00:36:4=
9 WARN mapred.LocalJobRunner: job_local1121514690_0001</div><div style=3D"m=
argin:0px;font-size:11px;font-family:Menlo">java.lang.Exception: java.lang.=
RuntimeException: Error in configuring object</div><div style=3D"margin:0px=
;font-size:11px;font-family:Menlo"><span style=3D"white-space:pre-wrap">	</=
span>at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java=
:354)</div><div style=3D"margin:0px;font-size:11px;font-family:Menlo">Cause=
d by: java.lang.RuntimeException: Error in configuring object</div><div sty=
le=3D"margin:0px;font-size:11px;font-family:Menlo"><span style=3D"white-spa=
ce:pre-wrap">	</span>at org.apache.hadoop.util.ReflectionUtils.setJobConf(R=
eflectionUtils.java:93)</div><div style=3D"margin:0px;font-size:11px;font-f=
amily:Menlo"><span style=3D"white-space:pre-wrap">	</span>at org.apache.had=
oop.util.ReflectionUtils.setConf(ReflectionUtils.java:64)</div><div style=
=3D"margin:0px;font-size:11px;font-family:Menlo"><span style=3D"white-space=
:pre-wrap">	</span>at org.apache.hadoop.util.ReflectionUtils.newInstance(Re=
flectionUtils.java:117)</div><div style=3D"margin:0px;font-size:11px;font-f=
amily:Menlo"><span style=3D"white-space:pre-wrap">	</span>at org.apache.had=
oop.mapred.MapTask.runOldMapper(MapTask.java:426)</div><div style=3D"margin=
:0px;font-size:11px;font-family:Menlo"><span style=3D"white-space:pre-wrap"=
>	</span>at org.apache.hadoop.mapred.MapTask.run(MapTask.java:366)</div><di=
v style=3D"margin:0px;font-size:11px;font-family:Menlo"><span style=3D"whit=
e-space:pre-wrap">	</span>at org.apache.hadoop.mapred.LocalJobRunner$Job$Ma=
pTaskRunnable.run(LocalJobRunner.java:223)</div><div style=3D"margin:0px;fo=
nt-size:11px;font-family:Menlo"><span style=3D"white-space:pre-wrap">	</spa=
n>at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511=
)</div><div style=3D"margin:0px;font-size:11px;font-family:Menlo"><span sty=
le=3D"white-space:pre-wrap">	</span>at java.util.concurrent.FutureTask.run(=
FutureTask.java:266)</div><div style=3D"margin:0px;font-size:11px;font-fami=
ly:Menlo"><span style=3D"white-space:pre-wrap">	</span>at java.util.concurr=
ent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)</div><div st=
yle=3D"margin:0px;font-size:11px;font-family:Menlo"><span style=3D"white-sp=
ace:pre-wrap">	</span>at java.util.concurrent.ThreadPoolExecutor$Worker.run=
(ThreadPoolExecutor.java:617)</div><div style=3D"margin:0px;font-size:11px;=
font-family:Menlo"><span style=3D"white-space:pre-wrap">	</span>at java.lan=
g.Thread.run(Thread.java:745)</div><div style=3D"margin:0px;font-size:11px;=
font-family:Menlo">Caused by: java.lang.reflect.InvocationTargetException</=
div><div style=3D"margin:0px;font-size:11px;font-family:Menlo"><span style=
=3D"white-space:pre-wrap">	</span>at sun.reflect.NativeMethodAccessorImpl.i=
nvoke0(Native Method)</div><div style=3D"margin:0px;font-size:11px;font-fam=
ily:Menlo"><span style=3D"white-space:pre-wrap">	</span>at sun.reflect.Nati=
veMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)</div><div sty=
le=3D"margin:0px;font-size:11px;font-family:Menlo"><span style=3D"white-spa=
ce:pre-wrap">	</span>at sun.reflect.DelegatingMethodAccessorImpl.invoke(Del=
egatingMethodAccessorImpl.java:43)</div><div style=3D"margin:0px;font-size:=
11px;font-family:Menlo"><span style=3D"white-space:pre-wrap">	</span>at jav=
a.lang.reflect.Method.invoke(Method.java:483)</div><div style=3D"margin:0px=
;font-size:11px;font-family:Menlo"><span style=3D"white-space:pre-wrap">	</=
span>at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.j=
ava:88)</div><div style=3D"margin:0px;font-size:11px;font-family:Menlo"><sp=
an style=3D"white-space:pre-wrap">	</span>... 10 more</div><div style=3D"ma=
rgin:0px;font-size:11px;font-family:Menlo">Caused by: java.lang.NoClassDefF=
oundError: org/json/JSONException</div><div style=3D"margin:0px;font-size:1=
1px;font-family:Menlo"><span style=3D"white-space:pre-wrap">	</span>at java=
.lang.Class.forName0(Native Method)</div><div style=3D"margin:0px;font-size=
:11px;font-family:Menlo"><span style=3D"white-space:pre-wrap">	</span>at ja=
va.lang.Class.forName(Class.java:344)</div><div style=3D"margin:0px;font-si=
ze:11px;font-family:Menlo"><span style=3D"white-space:pre-wrap">	</span>at =
org.apache.hadoop.conf.Configuration.getClassByName(Configuration.java:810)=
</div><div style=3D"margin:0px;font-size:11px;font-family:Menlo"><span styl=
e=3D"white-space:pre-wrap">	</span>at org.apache.hadoop.conf.Configuration.=
getClass(Configuration.java:855)</div><div style=3D"margin:0px;font-size:11=
px;font-family:Menlo"><span style=3D"white-space:pre-wrap">	</span>at org.a=
pache.hadoop.conf.Configuration.getClass(Configuration.java:881)</div><div =
style=3D"margin:0px;font-size:11px;font-family:Menlo"><span style=3D"white-=
space:pre-wrap">	</span>at org.apache.hadoop.mapred.JobConf.getMapperClass(=
JobConf.java:968)</div><div style=3D"margin:0px;font-size:11px;font-family:=
Menlo"><span style=3D"white-space:pre-wrap">	</span>at org.apache.hadoop.ma=
pred.MapRunner.configure(MapRunner.java:34)</div><div style=3D"margin:0px;f=
ont-size:11px;font-family:Menlo"><span style=3D"white-space:pre-wrap">	</sp=
an>... 15 more</div><div style=3D"margin:0px;font-size:11px;font-family:Men=
lo">Caused by: java.lang.ClassNotFoundException: org.json.JSONException</di=
v><div style=3D"margin:0px;font-size:11px;font-family:Menlo"><span style=3D=
"white-space:pre-wrap">	</span>at java.net.URLClassLoader$1.run(URLClassLoa=
der.java:372)</div><div style=3D"margin:0px;font-size:11px;font-family:Menl=
o"><span style=3D"white-space:pre-wrap">	</span>at java.net.URLClassLoader$=
1.run(URLClassLoader.java:361)</div><div style=3D"margin:0px;font-size:11px=
;font-family:Menlo"><span style=3D"white-space:pre-wrap">	</span>at java.se=
curity.AccessController.doPrivileged(Native Method)</div><div style=3D"marg=
in:0px;font-size:11px;font-family:Menlo"><span style=3D"white-space:pre-wra=
p">	</span>at java.net.URLClassLoader.findClass(URLClassLoader.java:360)</d=
iv><div style=3D"margin:0px;font-size:11px;font-family:Menlo"><span style=
=3D"white-space:pre-wrap">	</span>at java.lang.ClassLoader.loadClass(ClassL=
oader.java:424)</div><div style=3D"margin:0px;font-size:11px;font-family:Me=
nlo"><span style=3D"white-space:pre-wrap">	</span>at java.lang.ClassLoader.=
loadClass(ClassLoader.java:357)</div><div style=3D"margin:0px;font-size:11p=
x;font-family:Menlo"><span style=3D"white-space:pre-wrap">	</span>... 22 mo=
re</div><div style=3D"margin:0px;font-size:11px;font-family:Menlo">15/04/30=
 00:36:50 INFO mapred.JobClient:=C2=A0 map 0% reduce 0%</div><div style=3D"=
margin:0px;font-size:11px;font-family:Menlo">15/04/30 00:36:50 INFO mapred.=
JobClient: Job complete: job_local1121514690_0001</div><div style=3D"margin=
:0px;font-size:11px;font-family:Menlo">15/04/30 00:36:50 INFO mapred.JobCli=
ent: Counters: 0</div><div style=3D"margin:0px;font-size:11px;font-family:M=
enlo">15/04/30 00:36:50 INFO mapred.JobClient: Job Failed: NA</div><div sty=
le=3D"margin:0px;font-size:11px;font-family:Menlo">Exception in thread &quo=
t;main&quot; java.io.IOException: Job failed!</div><div style=3D"margin:0px=
;font-size:11px;font-family:Menlo"><span style=3D"white-space:pre-wrap">	</=
span>at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1357)</div=
><div style=3D"margin:0px;font-size:11px;font-family:Menlo"><span style=3D"=
white-space:pre-wrap">	</span>at org.myorg.Wordcount.main(Wordcount.java:64=
)</div><div style=3D"margin:0px;font-size:11px;font-family:Menlo"><span sty=
le=3D"white-space:pre-wrap">	</span>at sun.reflect.NativeMethodAccessorImpl=
.invoke0(Native Method)</div><div style=3D"margin:0px;font-size:11px;font-f=
amily:Menlo"><span style=3D"white-space:pre-wrap">	</span>at sun.reflect.Na=
tiveMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)</div><div s=
tyle=3D"margin:0px;font-size:11px;font-family:Menlo"><span style=3D"white-s=
pace:pre-wrap">	</span>at sun.reflect.DelegatingMethodAccessorImpl.invoke(D=
elegatingMethodAccessorImpl.java:43)</div><div style=3D"margin:0px;font-siz=
e:11px;font-family:Menlo"><span style=3D"white-space:pre-wrap">	</span>at j=
ava.lang.reflect.Method.invoke(Method.java:483)</div><div style=3D"margin:0=
px;font-size:11px;font-family:Menlo"><span style=3D"white-space:pre-wrap">	=
</span>at org.apache.hadoop.util.RunJar.main(RunJar.java:160)</div></div><d=
iv><br></div><div><br></div><div>PS: When I modify the same code and exclud=
e the JSON parsing i.e. find frequency of {=E2=80=98key=E2=80=99:=E2=80=99v=
alue1=E2=80=99} section of the example input, all works well.</div><div><br=
></div></div></blockquote></div><br></div>
</div></div></blockquote></div><br></div>
</blockquote></div>

--047d7bd6be22b5e3e305151efe30--