Mailing-List: contact user-help@hadoop.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@hadoop.apache.org
Received-SPF: pass (athena.apache.org: domain of unmeshabiju@gmail.com
 designates 209.85.212.42 as permitted sender)
MIME-Version: 1.0
In-Reply-To: 
 <CACp0qUGXdeJh0H60mxPKPgpYAdb+Kb43S6kzLXxG=+tTjZLPSw@mail.gmail.com>
References: 
 <CACp0qUG8aUAybGEKzSW7zKQpaapXTLDW4Gm36jNivT2dmFcFEw@mail.gmail.com>
 <CACp0qUGsQm+hTJKsjekB=jC7qOTyZi_ZCSok8yoqS2icPY5V5w@mail.gmail.com>
 <B83ECEB5BC76C5429C9BADC50B13271A47E2CC@sbssvex20.suntecsbs.com>
 <CACp0qUEkB3qB2HQz6HhEHgaDjTsxNb99Wx3v+0p518JMnmBbrw@mail.gmail.com>
 <B83ECEB5BC76C5429C9BADC50B13271A47E2CE@sbssvex20.suntecsbs.com>
 <CACp0qUGY207VQuFuoNJtKYR7PQ8nn+M4a+iFVOTEBf4aiCku=Q@mail.gmail.com>
 <CACp0qUGXdeJh0H60mxPKPgpYAdb+Kb43S6kzLXxG=+tTjZLPSw@mail.gmail.com>
From: unmesha sreeveni <unmeshabiju@gmail.com>
Date: Fri, 17 Jan 2014 15:46:37 +0530
Message-ID: 
 <CACp0qUFi36cOQtcntqdRdhUvHwWHNCx1r3eerxW58nzBDXfpbQ@mail.gmail.com>
Subject: Re: Sorting a csv file
To: User Hadoop <user@hadoop.apache.org>
Content-Type: multipart/alternative; boundary=047d7bd6bd76bc911004f027d885

--047d7bd6bd76bc911004f027d885
Content-Type: text/plain; charset=ISO-8859-1

are we able to sort multiple columns dynamically as the user suggests?
ie user requests to sort col1 and col2
then the user request to sort 3 cols
I am not able to find anyof the stuff through googling


On Thu, Jan 16, 2014 at 4:03 PM, unmesha sreeveni <unmeshabiju@gmail.com>wrote:

> yes i did ..
> But how to make it in decending order?
>
> My current code run in accending order
>
> *public class SortingCsv {*
>  * public static class Map extends Mapper<LongWritable, Text, Text, Text>
> {*
> *    private Text word = new Text();*
> *    private Text one = new Text();*
>
> *    public void map(LongWritable key, Text value, Context context) throws
> IOException, InterruptedException {*
> *     System.out.println("in mapper");*
> *     /**
> *     * sort*
> *     */*
> *     ArrayList<String> ar = new ArrayList<String>(); *
> *     String line = value.toString();*
> *     String[] tokens = null;*
> *     ar.add(line);*
> *     System.out.println("list: "+ar);*
> *     for(int i=0;i<ar.size();i++) {*
> *            tokens=(ar.get(i)).split(",");*
> *            System.out.println("ele: "+ar.get(i));*
> *            System.out.println("token: "+tokens[1]); //change according
> to user input*
> *            word.set(tokens[1]);*
> *            one.set(ar.get(i));*
> *            context.write(word, one);*
> *         }*
> *    }*
> * } *
> * public static void main(String[] args) throws Exception {*
> * System.out.println("in main");*
> *    Configuration conf = new Configuration();*
>
> *        Job job = new Job(conf, "wordcount");*
> *        job.setJarByClass(SortingCsv.class);*
> *        //Path intermediateInfo = new Path("out");*
> *    job.setOutputKeyClass(Text.class);*
> *    job.setOutputValueClass(Text.class);*
>
> *    job.setMapperClass(Map.class);*
> *    FileSystem fs = FileSystem.get(conf);*
>
>  * /* Delete the files if any in the output path */*
>
>  * if (fs.exists(new Path(args[1])))*
> * fs.delete(new Path(args[1]), true);*
>
>
> *    job.setInputFormatClass(TextInputFormat.class);*
> *    job.setOutputFormatClass(TextOutputFormat.class);*
>
> *    FileInputFormat.addInputPath(job, new Path(args[0]));*
> *    FileOutputFormat.setOutputPath(job, new Path(args[1]));*
>
> *    job.waitForCompletion(true);*
> * }*
>
>
>
> On Thu, Jan 16, 2014 at 10:26 AM, unmesha sreeveni <unmeshabiju@gmail.com>wrote:
>
>> Thanks for ur reply Ramya
>> ok :) .so should i need to transpose the entire .csv file inorder to get
>> the entire col 2 data?
>>
>>
>> On Thu, Jan 16, 2014 at 10:11 AM, Ramya S <ramyas@suntecgroup.com> wrote:
>>
>>> Try to keep col2 values as  map output key  and map output value as the
>>> total values " b,a,v "
>>>
>>>
>>>
>>> Regards...
>>> Ramya.S
>>>
>>>
>>>
>>> ________________________________
>>>
>>> From: unmesha sreeveni [mailto:unmeshabiju@gmail.com]
>>> Sent: Thu 1/16/2014 9:29 AM
>>> To: User Hadoop
>>> Subject: Re: Sorting a csv file
>>>
>>>
>>> Thanks Ramya.s
>>> I was trying it to do with NULLWRITABLE..
>>>
>>> Thanks alot Ramya.
>>>
>>> And do u have any idea how to sort a given col.
>>> Say if user is giving col2 to sort the i want to get as
>>> b,a,v
>>> a,c,p
>>> d,a,z
>>> q,z,a
>>> r,a,b
>>>
>>> b,a,v
>>> d,a,z
>>> r,a,b
>>>
>>> a,c,p
>>>
>>> q,z,a
>>>
>>> How do i approch to that.
>>>
>>> I my current implementation i am getting
>>> result as
>>> a,c,p
>>> b,a,v
>>> d,a,z
>>> q,z,a
>>> r,a,b
>>>
>>>
>>> using the above code.
>>>
>>>
>>> On Wed, Jan 15, 2014 at 5:09 PM, Ramya S <ramyas@suntecgroup.com> wrote:
>>>
>>>
>>>         All you need is to change the map output value class to TEXT
>>> format.
>>>         Set this accordingly in the main.
>>>
>>>         Eg:
>>>
>>>         public static class Map extends Mapper<LongWritable, Text, Text,
>>> Text> {
>>>            private Text one = new Text("");
>>>
>>>            private Text word = new Text();
>>>
>>>            public void map(LongWritable key, Text value, Context
>>> context) throws IOException, InterruptedException {
>>>             System.out.println("in mapper");
>>>                String line = value.toString();
>>>                StringTokenizer tokenizer = new StringTokenizer(line);
>>>                while (tokenizer.hasMoreTokens()) {
>>>                    word.set(tokenizer.nextToken());
>>>                    context.write(word, one);
>>>                    System.out.println("sort: "+word);
>>>                }
>>>            }
>>>         }
>>>
>>>
>>>         Regards...?
>>>         Ramya.S
>>>
>>>
>>>         ________________________________
>>>
>>>         From: unmesha sreeveni [mailto:unmeshabiju@gmail.com]
>>>         Sent: Wed 1/15/2014 4:11 PM
>>>         To: User Hadoop
>>>         Subject: Re: Sorting a csv file
>>>
>>>
>>>
>>>         I did a map only job for sorting a txt file by editing wordcount
>>> program.
>>>         I only need the key .
>>>         How to set value to null.
>>>
>>>
>>>         public class SortingCsv {
>>>         public static class Map extends Mapper<LongWritable, Text, Text,
>>> IntWritable> {
>>>            private final static IntWritable one = new IntWritable(1);
>>>            private Text word = new Text();
>>>
>>>            public void map(LongWritable key, Text value, Context
>>> context) throws IOException, InterruptedException {
>>>             System.out.println("in mapper");
>>>                String line = value.toString();
>>>                StringTokenizer tokenizer = new StringTokenizer(line);
>>>                while (tokenizer.hasMoreTokens()) {
>>>                    word.set(tokenizer.nextToken());
>>>                    context.write(word, one);
>>>                    System.out.println("sort: "+word);
>>>                }
>>>            }
>>>         }
>>>         public static void main(String[] args) throws Exception {
>>>         System.out.println("in main");
>>>            Configuration conf = new Configuration();
>>>
>>>                Job job = new Job(conf, "wordcount");
>>>                job.setJarByClass(SortingCsv.class);
>>>                //Path intermediateInfo = new Path("out");
>>>            job.setOutputKeyClass(Text.class);
>>>            job.setOutputValueClass(IntWritable.class);
>>>
>>>            job.setMapperClass(Map.class);
>>>            FileSystem fs = FileSystem.get(conf);
>>>
>>>         /* Delete the files if any in the output path */
>>>
>>>         if (fs.exists(new Path(args[1])))
>>>         fs.delete(new Path(args[1]), true);
>>>
>>>
>>>            job.setInputFormatClass(TextInputFormat.class);
>>>            job.setOutputFormatClass(TextOutputFormat.class);
>>>
>>>            FileInputFormat.addInputPath(job, new Path(args[0]));
>>>            FileOutputFormat.setOutputPath(job, new Path(args[1]));
>>>
>>>            job.waitForCompletion(true);
>>>         }
>>>
>>>         }
>>>
>>>
>>>         On Wed, Jan 15, 2014 at 2:50 PM, unmesha sreeveni <
>>> unmeshabiju@gmail.com> wrote:
>>>
>>>
>>>                 How to sort a csv file
>>>                 I know , between map and reduce shuffle and sort is
>>> taking place.
>>>                 But how do i sort each column in a csv file?
>>>
>>>
>>>                 --
>>>
>>>                 Thanks & Regards
>>>
>>>
>>>                 Unmesha Sreeveni U.B
>>>
>>>                 Junior Developer
>>>
>>>                 http://www.unmeshasreeveni.blogspot.in/
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>         --
>>>
>>>         Thanks & Regards
>>>
>>>
>>>         Unmesha Sreeveni U.B
>>>
>>>         Junior Developer
>>>
>>>         http://www.unmeshasreeveni.blogspot.in/
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>> --
>>>
>>> Thanks & Regards
>>>
>>>
>>> Unmesha Sreeveni U.B
>>>
>>> Junior Developer
>>>
>>> http://www.unmeshasreeveni.blogspot.in/
>>>
>>>
>>>
>>>
>>>
>>
>>
>> --
>> *Thanks & Regards*
>>
>> Unmesha Sreeveni U.B
>> Junior Developer
>>
>> http://www.unmeshasreeveni.blogspot.in/
>>
>>
>>
>
>
> --
> *Thanks & Regards*
>
> Unmesha Sreeveni U.B
> Junior Developer
>
> http://www.unmeshasreeveni.blogspot.in/
>
>
>


-- 
*Thanks & Regards*

Unmesha Sreeveni U.B
Junior Developer

http://www.unmeshasreeveni.blogspot.in/

--047d7bd6bd76bc911004f027d885
Content-Type: text/html; charset=ISO-8859-1
Content-Transfer-Encoding: quoted-printable

<div dir=3D"ltr"><div class=3D"gmail_default" style=3D"font-family:verdana,=
sans-serif">are we able to sort multiple columns dynamically as the user su=
ggests?</div><div class=3D"gmail_default" style=3D"font-family:verdana,sans=
-serif">


ie user requests to sort col1 and col2</div><div class=3D"gmail_default" st=
yle=3D"font-family:verdana,sans-serif">then the user request to sort 3 cols=
</div><div class=3D"gmail_extra"><div class=3D"gmail_default" style=3D"font=
-family:verdana,sans-serif">

I am not able to find anyof the stuff through googling</div><br><br><div cl=
ass=3D"gmail_quote">On Thu, Jan 16, 2014 at 4:03 PM, unmesha sreeveni <span=
 dir=3D"ltr">&lt;<a href=3D"mailto:unmeshabiju@gmail.com" target=3D"_blank"=
>unmeshabiju@gmail.com</a>&gt;</span> wrote:<br>


<blockquote class=3D"gmail_quote" style=3D"margin:0 0 0 .8ex;border-left:1p=
x #ccc solid;padding-left:1ex"><div dir=3D"ltr"><div class=3D"gmail_default=
" style=3D"font-family:verdana,sans-serif">yes i did ..</div><div class=3D"=
gmail_default" style=3D"font-family:verdana,sans-serif">


But how to make it in decending order?</div><div class=3D"gmail_default" st=
yle=3D"font-family:verdana,sans-serif">
<br></div><div class=3D"gmail_default" style=3D"font-family:verdana,sans-se=
rif">My current code run in accending order</div><div class=3D"gmail_defaul=
t" style=3D"font-family:verdana,sans-serif"><br></div><div class=3D"gmail_d=
efault">


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i>public c=
lass SortingCsv {</i></font></div><div class=3D"gmail_default"><span style=
=3D"white-space:pre-wrap"><font face=3D"verdana, sans-serif"><i>	</i></font=
></span></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span>public static class Map extends Mapper=
&lt;LongWritable, Text, Text, Text&gt; {</i></font></div><div><div class=3D=
"gmail_default">


<font face=3D"verdana, sans-serif"><i><span style=3D"white-space:pre-wrap">=
	</span> =A0 =A0private Text word =3D new Text();</i></font></div></div><di=
v class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span style=
=3D"white-space:pre-wrap">	</span> =A0 =A0private Text one =3D new Text();<=
/i></font></div>


<div>
<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0=A0</i></font></div><div class=3D"=
gmail_default"><font face=3D"verdana, sans-serif"><i><span style=3D"white-s=
pace:pre-wrap">	</span> =A0 =A0public void map(LongWritable key, Text value=
, Context context) throws IOException, InterruptedException {</i></font></d=
iv>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0<span style=3D"white-space:pre=
-wrap">	</span>System.out.println(&quot;in mapper&quot;);</i></font></div><=
/div><div class=3D"gmail_default">


<font face=3D"verdana, sans-serif"><i><span style=3D"white-space:pre-wrap">=
	</span> =A0 =A0<span style=3D"white-space:pre-wrap">	</span>/*</i></font><=
/div><div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><sp=
an style=3D"white-space:pre-wrap">	</span> =A0 =A0<span style=3D"white-spac=
e:pre-wrap">	</span> * sort</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0<span style=3D"white-space:pre=
-wrap">	</span> */</i></font></div><div class=3D"gmail_default"><font face=
=3D"verdana, sans-serif"><i><span style=3D"white-space:pre-wrap">	</span> =
=A0 =A0<span style=3D"white-space:pre-wrap">	</span> ArrayList&lt;String&gt=
; ar =3D new ArrayList&lt;String&gt;();=A0</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0<span style=3D"white-space:pre=
-wrap">	</span>String line =3D value.toString();</i></font></div><div class=
=3D"gmail_default">


<font face=3D"verdana, sans-serif"><i><span style=3D"white-space:pre-wrap">=
	</span> =A0 =A0<span style=3D"white-space:pre-wrap">	</span> String[] toke=
ns =3D null;</i></font></div><div class=3D"gmail_default"><font face=3D"ver=
dana, sans-serif"><i><span style=3D"white-space:pre-wrap">	</span> =A0 =A0<=
span style=3D"white-space:pre-wrap">	</span> ar.add(line);</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0<span style=3D"white-space:pre=
-wrap">	</span> System.out.println(&quot;list: &quot;+ar);</i></font></div>
<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0<span style=3D"white-space:pre=
-wrap">	</span> for(int i=3D0;i&lt;ar.size();i++) {</i></font></div><div cl=
ass=3D"gmail_default">


<font face=3D"verdana, sans-serif"><i><span style=3D"white-space:pre-wrap">=
	</span> =A0 =A0 =A0 =A0 =A0 =A0tokens=3D(ar.get(i)).split(&quot;,&quot;);<=
/i></font></div><div class=3D"gmail_default"><font face=3D"verdana, sans-se=
rif"><i><span style=3D"white-space:pre-wrap">	</span> =A0 =A0 =A0 =A0 =A0 =
=A0System.out.println(&quot;ele: &quot;+ar.get(i));</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0 =A0 =A0 =A0 =A0System.out.pri=
ntln(&quot;token: &quot;+tokens[1]); //change according to user input</i></=
font></div>
<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0 =A0 =A0 =A0 =A0word.set(token=
s[1]);</i></font></div><div class=3D"gmail_default"><font face=3D"verdana, =
sans-serif"><i><span style=3D"white-space:pre-wrap">	</span> =A0 =A0 =A0 =
=A0 =A0 =A0one.set(ar.get(i));</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0 =A0 =A0 =A0 =A0context.write(=
word, one);</i></font></div><div><div class=3D"gmail_default"><font face=3D=
"verdana, sans-serif"><i><span style=3D"white-space:pre-wrap">	</span> =A0 =
=A0 =A0 =A0 }</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0}</i></font></div><div class=
=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span style=3D"whi=
te-space:pre-wrap">	</span> }=A0</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> public static void main(String[] args=
) throws Exception {</i></font></div><div class=3D"gmail_default"><font fac=
e=3D"verdana, sans-serif"><i><span style=3D"white-space:pre-wrap">		</span>=
 System.out.println(&quot;in main&quot;);</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0Configuration conf =3D new Con=
figuration();</i></font></div><div class=3D"gmail_default"><font face=3D"ve=
rdana, sans-serif"><i><span style=3D"white-space:pre-wrap">	</span> =A0 =A0=
 =A0 =A0</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0 =A0 =A0Job job =3D new Job(co=
nf, &quot;wordcount&quot;);</i></font></div><div class=3D"gmail_default"><f=
ont face=3D"verdana, sans-serif"><i><span style=3D"white-space:pre-wrap">	<=
/span> =A0 =A0 =A0 =A0job.setJarByClass(SortingCsv.class);</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0 =A0 =A0//Path intermediateInf=
o =3D new Path(&quot;out&quot;);</i></font></div><div class=3D"gmail_defaul=
t"><font face=3D"verdana, sans-serif"><i><span style=3D"white-space:pre-wra=
p">	</span> =A0 =A0job.setOutputKeyClass(Text.class);</i></font></div>


</div><div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><s=
pan style=3D"white-space:pre-wrap">	</span> =A0 =A0job.setOutputValueClass(=
Text.class);</i></font></div><div><div class=3D"gmail_default"><font face=
=3D"verdana, sans-serif"><i><span style=3D"white-space:pre-wrap">	</span> =
=A0 =A0 =A0 =A0</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0job.setMapperClass(Map.class);=
</i></font></div><div class=3D"gmail_default"><font face=3D"verdana, sans-s=
erif"><i><span style=3D"white-space:pre-wrap">	</span> =A0 =A0FileSystem fs=
 =3D FileSystem.get(conf);</i></font></div>


<div class=3D"gmail_default"><span style=3D"white-space:pre-wrap"><font fac=
e=3D"verdana, sans-serif"><i>	</i></font></span></div><div class=3D"gmail_d=
efault"><font face=3D"verdana, sans-serif"><i><br></i></font></div><div cla=
ss=3D"gmail_default">


<font face=3D"verdana, sans-serif"><i><span style=3D"white-space:pre-wrap">=
		</span>/* Delete the files if any in the output path */</i></font></div><=
div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><br></i><=
/font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">		</span>if (fs.exists(new Path(args[1])))</i>=
</font></div><div class=3D"gmail_default"><font face=3D"verdana, sans-serif=
"><i><span style=3D"white-space:pre-wrap">			</span>fs.delete(new Path(args=
[1]), true);</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><br></i>=
</font></div><div class=3D"gmail_default"><font face=3D"verdana, sans-serif=
"><i><span style=3D"white-space:pre-wrap">	</span> =A0 =A0 =A0 =A0</i></fon=
t></div><div class=3D"gmail_default">


<font face=3D"verdana, sans-serif"><i><span style=3D"white-space:pre-wrap">=
	</span> =A0 =A0job.setInputFormatClass(TextInputFormat.class);</i></font><=
/div><div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><sp=
an style=3D"white-space:pre-wrap">	</span> =A0 =A0job.setOutputFormatClass(=
TextOutputFormat.class);</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0 =A0 =A0</i></font></div><div =
class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span style=
=3D"white-space:pre-wrap">	</span> =A0 =A0FileInputFormat.addInputPath(job,=
 new Path(args[0]));</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0FileOutputFormat.setOutputPath=
(job, new Path(args[1]));</i></font></div><div class=3D"gmail_default"><fon=
t face=3D"verdana, sans-serif"><i><span style=3D"white-space:pre-wrap">	</s=
pan> =A0 =A0 =A0 =A0</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span> =A0 =A0job.waitForCompletion(true);</=
i></font></div><div class=3D"gmail_default"><font face=3D"verdana, sans-ser=
if"><i><span style=3D"white-space:pre-wrap">	</span> }</i></font></div>


<div class=3D"gmail_default"><font face=3D"verdana, sans-serif"><i><span st=
yle=3D"white-space:pre-wrap">	</span>=A0 =A0</i></font></div></div></div></=
div><div><div><div class=3D"gmail_extra"><br><br><div class=3D"gmail_quote"=
>
On Thu, Jan 16, 2014 at 10:26 AM, unmesha sreeveni <span dir=3D"ltr">&lt;<a=
 href=3D"mailto:unmeshabiju@gmail.com" target=3D"_blank">unmeshabiju@gmail.=
com</a>&gt;</span> wrote:<br>
<blockquote class=3D"gmail_quote" style=3D"margin:0 0 0 .8ex;border-left:1p=
x #ccc solid;padding-left:1ex"><div dir=3D"ltr"><div class=3D"gmail_default=
" style=3D"font-family:verdana,sans-serif">Thanks for ur reply Ramya</div><=
div class=3D"gmail_default" style=3D"font-family:verdana,sans-serif">


ok :) .so should i need to transpose the entire .csv file inorder to get th=
e entire col 2 data?</div>
</div><div><div><div class=3D"gmail_extra"><br><br><div class=3D"gmail_quot=
e">On Thu, Jan 16, 2014 at 10:11 AM, Ramya S <span dir=3D"ltr">&lt;<a href=
=3D"mailto:ramyas@suntecgroup.com" target=3D"_blank">ramyas@suntecgroup.com=
</a>&gt;</span> wrote:<br>


<blockquote class=3D"gmail_quote" style=3D"margin:0 0 0 .8ex;border-left:1p=
x #ccc solid;padding-left:1ex">Try to keep col2 values as =A0map output key=
 =A0and map output value as the total values &quot; b,a,v &quot;<br>
<br>
<br>
<br>
Regards...<br>
<div>Ramya.S<br>
<br>
<br>
<br>
________________________________<br>
<br>
From: unmesha sreeveni [mailto:<a href=3D"mailto:unmeshabiju@gmail.com" tar=
get=3D"_blank">unmeshabiju@gmail.com</a>]<br>
</div>Sent: Thu 1/16/2014 9:29 AM<br>
<div><div>To: User Hadoop<br>
Subject: Re: Sorting a csv file<br>
<br>
<br>
Thanks Ramya.s<br>
I was trying it to do with NULLWRITABLE..<br>
<br>
Thanks alot Ramya.<br>
<br>
And do u have any idea how to sort a given col.<br>
Say if user is giving col2 to sort the i want to get as<br>
b,a,v<br>
a,c,p<br>
d,a,z<br>
q,z,a<br>
r,a,b<br>
<br>
b,a,v<br>
d,a,z<br>
r,a,b<br>
<br>
a,c,p<br>
<br>
q,z,a<br>
<br>
How do i approch to that.<br>
<br>
I my current implementation i am getting<br>
result as<br>
a,c,p<br>
b,a,v<br>
d,a,z<br>
q,z,a<br>
r,a,b<br>
<br>
<br>
using the above code.<br>
<br>
<br>
On Wed, Jan 15, 2014 at 5:09 PM, Ramya S &lt;<a href=3D"mailto:ramyas@sunte=
cgroup.com" target=3D"_blank">ramyas@suntecgroup.com</a>&gt; wrote:<br>
<br>
<br>
=A0 =A0 =A0 =A0 All you need is to change the map output value class to TEX=
T format.<br>
=A0 =A0 =A0 =A0 Set this accordingly in the main.<br>
<br>
=A0 =A0 =A0 =A0 Eg:<br>
<br>
=A0 =A0 =A0 =A0 public static class Map extends Mapper&lt;LongWritable, Tex=
t, Text, Text&gt; {<br>
=A0 =A0 =A0 =A0 =A0 =A0private Text one =3D new Text(&quot;&quot;);<br>
<br>
=A0 =A0 =A0 =A0 =A0 =A0private Text word =3D new Text();<br>
<br>
=A0 =A0 =A0 =A0 =A0 =A0public void map(LongWritable key, Text value, Contex=
t context) throws IOException, InterruptedException {<br>
=A0 =A0 =A0 =A0 =A0 =A0 System.out.println(&quot;in mapper&quot;);<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0String line =3D value.toString();<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0StringTokenizer tokenizer =3D new StringToke=
nizer(line);<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0while (tokenizer.hasMoreTokens()) {<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0word.set(tokenizer.nextToken());<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0context.write(word, one);<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0System.out.println(&quot;sort: &quot=
;+word);<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0}<br>
=A0 =A0 =A0 =A0 =A0 =A0}<br>
=A0 =A0 =A0 =A0 }<br>
<br>
<br>
=A0 =A0 =A0 =A0 Regards...?<br>
=A0 =A0 =A0 =A0 Ramya.S<br>
<br>
<br>
=A0 =A0 =A0 =A0 ________________________________<br>
<br>
=A0 =A0 =A0 =A0 From: unmesha sreeveni [mailto:<a href=3D"mailto:unmeshabij=
u@gmail.com" target=3D"_blank">unmeshabiju@gmail.com</a>]<br>
=A0 =A0 =A0 =A0 Sent: Wed 1/15/2014 4:11 PM<br>
=A0 =A0 =A0 =A0 To: User Hadoop<br>
=A0 =A0 =A0 =A0 Subject: Re: Sorting a csv file<br>
<br>
<br>
<br>
=A0 =A0 =A0 =A0 I did a map only job for sorting a txt file by editing word=
count program.<br>
=A0 =A0 =A0 =A0 I only need the key .<br>
=A0 =A0 =A0 =A0 How to set value to null.<br>
<br>
<br>
=A0 =A0 =A0 =A0 public class SortingCsv {<br>
=A0 =A0 =A0 =A0 public static class Map extends Mapper&lt;LongWritable, Tex=
t, Text, IntWritable&gt; {<br>
=A0 =A0 =A0 =A0 =A0 =A0private final static IntWritable one =3D new IntWrit=
able(1);<br>
=A0 =A0 =A0 =A0 =A0 =A0private Text word =3D new Text();<br>
<br>
=A0 =A0 =A0 =A0 =A0 =A0public void map(LongWritable key, Text value, Contex=
t context) throws IOException, InterruptedException {<br>
=A0 =A0 =A0 =A0 =A0 =A0 System.out.println(&quot;in mapper&quot;);<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0String line =3D value.toString();<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0StringTokenizer tokenizer =3D new StringToke=
nizer(line);<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0while (tokenizer.hasMoreTokens()) {<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0word.set(tokenizer.nextToken());<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0context.write(word, one);<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0System.out.println(&quot;sort: &quot=
;+word);<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0}<br>
=A0 =A0 =A0 =A0 =A0 =A0}<br>
=A0 =A0 =A0 =A0 }<br>
=A0 =A0 =A0 =A0 public static void main(String[] args) throws Exception {<b=
r>
=A0 =A0 =A0 =A0 System.out.println(&quot;in main&quot;);<br>
=A0 =A0 =A0 =A0 =A0 =A0Configuration conf =3D new Configuration();<br>
<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0Job job =3D new Job(conf, &quot;wordcount&qu=
ot;);<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0job.setJarByClass(SortingCsv.class);<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0//Path intermediateInfo =3D new Path(&quot;o=
ut&quot;);<br>
=A0 =A0 =A0 =A0 =A0 =A0job.setOutputKeyClass(Text.class);<br>
=A0 =A0 =A0 =A0 =A0 =A0job.setOutputValueClass(IntWritable.class);<br>
<br>
=A0 =A0 =A0 =A0 =A0 =A0job.setMapperClass(Map.class);<br>
=A0 =A0 =A0 =A0 =A0 =A0FileSystem fs =3D FileSystem.get(conf);<br>
<br>
=A0 =A0 =A0 =A0 /* Delete the files if any in the output path */<br>
<br>
=A0 =A0 =A0 =A0 if (fs.exists(new Path(args[1])))<br>
=A0 =A0 =A0 =A0 fs.delete(new Path(args[1]), true);<br>
<br>
<br>
=A0 =A0 =A0 =A0 =A0 =A0job.setInputFormatClass(TextInputFormat.class);<br>
=A0 =A0 =A0 =A0 =A0 =A0job.setOutputFormatClass(TextOutputFormat.class);<br=
>
<br>
=A0 =A0 =A0 =A0 =A0 =A0FileInputFormat.addInputPath(job, new Path(args[0]))=
;<br>
=A0 =A0 =A0 =A0 =A0 =A0FileOutputFormat.setOutputPath(job, new Path(args[1]=
));<br>
<br>
=A0 =A0 =A0 =A0 =A0 =A0job.waitForCompletion(true);<br>
=A0 =A0 =A0 =A0 }<br>
<br>
=A0 =A0 =A0 =A0 }<br>
<br>
<br>
=A0 =A0 =A0 =A0 On Wed, Jan 15, 2014 at 2:50 PM, unmesha sreeveni &lt;<a hr=
ef=3D"mailto:unmeshabiju@gmail.com" target=3D"_blank">unmeshabiju@gmail.com=
</a>&gt; wrote:<br>
<br>
<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 How to sort a csv file<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 I know , between map and reduce shuffle and=
 sort is taking place.<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 But how do i sort each column in a csv file=
?<br>
<br>
<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 --<br>
<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 Thanks &amp; Regards<br>
<br>
<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 Unmesha Sreeveni U.B<br>
<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 Junior Developer<br>
<br>
=A0 =A0 =A0 =A0 =A0 =A0 =A0 =A0 <a href=3D"http://www.unmeshasreeveni.blogs=
pot.in/" target=3D"_blank">http://www.unmeshasreeveni.blogspot.in/</a><br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
=A0 =A0 =A0 =A0 --<br>
<br>
=A0 =A0 =A0 =A0 Thanks &amp; Regards<br>
<br>
<br>
=A0 =A0 =A0 =A0 Unmesha Sreeveni U.B<br>
<br>
=A0 =A0 =A0 =A0 Junior Developer<br>
<br>
=A0 =A0 =A0 =A0 <a href=3D"http://www.unmeshasreeveni.blogspot.in/" target=
=3D"_blank">http://www.unmeshasreeveni.blogspot.in/</a><br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
--<br>
<br>
Thanks &amp; Regards<br>
<br>
<br>
Unmesha Sreeveni U.B<br>
<br>
Junior Developer<br>
<br>
<a href=3D"http://www.unmeshasreeveni.blogspot.in/" target=3D"_blank">http:=
//www.unmeshasreeveni.blogspot.in/</a><br>
<br>
<br>
<br>
<br>
</div></div></blockquote></div><br><br clear=3D"all"><div><br></div>-- <br>=
<div dir=3D"ltr"><i style=3D"color:rgb(102,0,0)">Thanks &amp; Regards</i>
<div style=3D"color:rgb(102,0,0)"><i><br></i></div><div style=3D"color:rgb(=
102,0,0)">Unmesha Sreeveni U.B<i><br></i></div><div style=3D"color:rgb(102,=
0,0)">Junior Developer</div><div style=3D"color:rgb(102,0,0)"><br></div><di=
v style=3D"color:rgb(102,0,0)">


<a href=3D"http://www.unmeshasreeveni.blogspot.in/" target=3D"_blank">http:=
//www.unmeshasreeveni.blogspot.in/</a><br></div><div style=3D"color:rgb(102=
,0,0)"><br></div><i><span><br></span></i></div>
</div>
</div></div></blockquote></div><br><br clear=3D"all"><div><br></div>-- <br>=
<div dir=3D"ltr"><i style=3D"color:rgb(102,0,0)">Thanks &amp; Regards</i>
<div style=3D"color:rgb(102,0,0)"><i><br></i></div><div style=3D"color:rgb(=
102,0,0)">Unmesha Sreeveni U.B<i><br></i></div><div style=3D"color:rgb(102,=
0,0)">Junior Developer</div><div style=3D"color:rgb(102,0,0)"><br></div><di=
v style=3D"color:rgb(102,0,0)">


<a href=3D"http://www.unmeshasreeveni.blogspot.in/" target=3D"_blank">http:=
//www.unmeshasreeveni.blogspot.in/</a><br></div><div style=3D"color:rgb(102=
,0,0)"><br></div><i><span><br></span></i></div>
</div>
</div></div></blockquote></div><br><br clear=3D"all"><div><br></div>-- <br>=
<div dir=3D"ltr"><i style=3D"color:rgb(102,0,0)">Thanks &amp; Regards</i>
<div style=3D"color:rgb(102,0,0)"><i><br></i></div><div style=3D"color:rgb(=
102,0,0)">Unmesha Sreeveni U.B<i><br></i></div><div style=3D"color:rgb(102,=
0,0)">Junior Developer</div><div style=3D"color:rgb(102,0,0)"><br></div><di=
v style=3D"color:rgb(102,0,0)">


<a href=3D"http://www.unmeshasreeveni.blogspot.in/" target=3D"_blank">http:=
//www.unmeshasreeveni.blogspot.in/</a><br></div><div style=3D"color:rgb(102=
,0,0)"><br></div><i><span><br></span></i></div>
</div></div>

--047d7bd6bd76bc911004f027d885--