Mailing-List: contact user-help@hive.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@hive.apache.org
Received-SPF: pass (nike.apache.org: domain of Binhnt22@viettel.com.vn
 designates 203.113.131.24 as permitted sender)
Date: Wed, 11 Apr 2012 08:36:05 +0700
From: binhnt22 <Binhnt22@viettel.com.vn>
Subject: RE: [Marketing Mail] Re: Why BucketJoinMap consume too much memory
In-reply-to: 
 <3585CBC0139BC8459E2239E01D0B50F802E4988E@PROD-EXCH-M1.corp.microstrategy.com>
Sender: Binhnt22@viettel.com.vn
To: user@hive.apache.org
Message-id: <002401cd1783$76e842e0$64b8c8a0$@com.vn>
MIME-version: 1.0
Content-type: multipart/alternative;
 boundary="Boundary_(ID_Xs6DU59ehoTRUXpe5DR+0g)"
Content-language: en-us
Thread-index: AQHNFf6fcOnjvvAFRkWVAX+9nFOwWJaS1r0AgADG7YCAANrTgP//0YfAgACO65A=
References: <00ee01cd0edb$e1e39eb0$a5aadc10$@com.vn>
 <1333308918.82113.YahooMailNeo@web121202.mail.ne1.yahoo.com>
 <CA+OB-HBgdagcjjF8JjdfubF_TTrk6iHox-9sZijSJCSE5dhbOg@mail.gmail.com>
 <1333613229.2249.YahooMailNeo@web121202.mail.ne1.yahoo.com>
 <002701cd1313$eceaf560$c6c0e020$@com.vn>
 <CAORpBsi8yML+dixo=AfTk+1Qs_jhUAQkOOFJWRcy_riv=DSpPw@mail.gmail.com>
 <003a01cd131a$2f1a1b90$8d4e52b0$@com.vn>
 <CAORpBsgZRtuYetGpB0nosjDQ4hzp6rC92_t06eHzDPfebeW59Q@mail.gmail.com>
 <1333628555.67543.YahooMailNeo@web121201.mail.ne1.yahoo.com>
 <003f01cd1393$5dd14b10$1973e130$@com.vn>
 <CADo2yOAx3QanooCttcRXFU1o0V1dLvuRw7oTATgakaKM=7zVqQ@mail.gmail.com>
 <1333729985.29542.YahooMailNeo@web121205.mail.ne1.yahoo.com>
 <005201cd15fe$8c7c8660$a5759320$@com.vn>
 <1333982914.96478.YahooMailNeo@web121202.mail.ne1.yahoo.com>
 <003901cd16c3$4d4406b0$e7cc1410$@com.vn>
 <1334072625.34211.YahooMailNeo@web121206.mail.ne1.yahoo.com>
 <3585CBC0139BC8459E2239E01D0B50F802E4988E@PROD-EXCH-M1.corp.microstrategy.com>

This is a multi-part message in MIME format.

--Boundary_(ID_Xs6DU59ehoTRUXpe5DR+0g)
Content-type: text/plain; charset=utf-8
Content-transfer-encoding: quoted-printable

Hi Ladda,

=20

Your case is pretty simple, when you make table alias (a11, a12), you =
should use it in the hint MAPJOIN

=20

That=E2=80=99s mean your sql should be look like:

=20

select /*+ MAPJOIN(a11) */ a12.shipper_id, count(1), count (distinct =
a11.customer_id), sum(a11.qty_sold) from orderfactpartclust2 a12 join =
orderdetailpartclust2 a11 on (a11.order_id =3D a12.order_id) where =
(a11.order_date =3D '09-30-2008' and a12.order_date =3D '2008-09-30') =
group by a12.shipper_id;

=20

Best regards

Nguyen Thanh Binh (Mr)

=20

From: Ladda, Anand [mailto:lanand@microstrategy.com]=20
Sent: Wednesday, April 11, 2012 3:23 AM
To: user@hive.apache.org
Subject: RE: [Marketing Mail] Re: Why BucketJoinMap consume too much =
memory

=20

Hi Bejoy/Binh

Been following this thread to better understand where bucket map join =
would help and it=E2=80=99s been a great thread to follow. I have =
struggling with this on my end as well.=20

=20

I have two tables one of which is about 22GB (orderdetailpartclust2) in =
size and the other is 1.5GB (orderfactpartclust2) in size (all =
partitions combined) and I wanted to see the impact of different kind of =
joins on one of the partitions of these table .=20

=20

I created a partitioned (order_date) and bucketed (on order_id, on which =
I want to join these tables) version for these tables for this analysis. =
Data was loaded from their non-partitioned counterparts and setting the =
following parameters to ensure that data makes it into the right =
partitions and is bucketed correctly by Hive

=20

set hive.exec.dynamic.partition.mode=3Dnonstrict;

set hive.exec.dynamic.partition=3Dtrue;

SET hive.exec.max.dynamic.partitions=3D100000;

SET hive.exec.max.dynamic.partitions.pernode=3D100000;

set hive.enforce.bucketing =3D true;

=20

However when I try to do the following join query, I don=E2=80=99t get =
any bucketed map side join

=20

select /*+ MAPJOIN(orderfactpartclust2) */ a12.shipper_id, count(1), =
count (distinct a11.customer_id), sum(a11.qty_sold) from =
orderfactpartclust2 a12 join orderdetailpartclust2 a11 on (a11.order_id =
=3D a12.order_id) where (a11.order_date =3D '09-30-2008' and =
a12.order_date =3D '2008-09-30') group by a12.shipper_id;

=20

Below are the relevant pieces of information on each of these tables. =
Can you please help take a look to see what I might be missing to get =
map side joins. Is it because my tables are also partitioned that this =
isn=E2=80=99t working?

=20

=20

1.       hive> describe formatted orderdetailpartclust2;

OK

# col_name              data_type               comment

=20

order_id                int                     from deserializer

item_id                 int                     from deserializer

emp_id                  int                     from deserializer

promotion_id            int                     from deserializer

customer_id             int                     from deserializer

qty_sold                float                   from deserializer

unit_price              float                   from deserializer

unit_cost               float                   from deserializer

discount                float                   from deserializer

=20

# Partition Information

# col_name              data_type               comment

=20

order_date              string                  None

=20

# Detailed Table Information

Database:               default

Owner:                  hdfs

CreateTime:             Thu Apr 05 17:01:22 EDT 2012

LastAccessTime:         UNKNOWN

Protect Mode:           None

Retention:              0

Location:               =
hdfs://hadoop001:6931/user/hive/warehouse/orderdetailpartclust2

Table Type:             MANAGED_TABLE

Table Parameters:

        SORTBUCKETCOLSPREFIX    TRUE

        numFiles                19200

        numPartitions           75

        numRows                 0

        totalSize               22814162038

        transient_lastDdlTime   1333725153

=20

# Storage Information

SerDe Library:          =
org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe

InputFormat:            org.apache.hadoop.hive.ql.io.RCFileInputFormat

OutputFormat:           org.apache.hadoop.hive.ql.io.RCFileOutputFormat

Compressed:             No

Num Buckets:            256

Bucket Columns:         [order_id]

Sort Columns:           [Order(col:order_id, order:1)]

Storage Desc Params:

        escape.delim            \\

        field.delim             \t

        serialization.format    \t

Time taken: 3.255 seconds

2.       hive> describe formatted orderfactpartclust2;

OK

# col_name              data_type               comment

=20

order_id                int                     from deserializer

emp_id                  int                     from deserializer

order_amt               float                   from deserializer

order_cost              float                   from deserializer

qty_sold                float                   from deserializer

freight                 float                   from deserializer

gross_dollar_sales      float                   from deserializer

ship_date               string                  from deserializer

rush_order              string                  from deserializer

customer_id             int                     from deserializer

pymt_type               int                     from deserializer

shipper_id              int                     from deserializer

=20

# Partition Information

# col_name              data_type               comment

=20

order_date              string                  None

=20

# Detailed Table Information

Database:               default

Owner:                  hdfs

CreateTime:             Thu Apr 05 18:09:28 EDT 2012

LastAccessTime:         UNKNOWN

Protect Mode:           None

Retention:              0

Location:               =
hdfs://hadoop001:6931/user/hive/warehouse/orderfactpartclust2

Table Type:             MANAGED_TABLE

Table Parameters:

        SORTBUCKETCOLSPREFIX    TRUE

        numFiles                7680

        numPartitions           30

        numRows                 0

        totalSize               1528946078

        transient_lastDdlTime   1333722539

=20

# Storage Information

SerDe Library:          =
org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe

InputFormat:            org.apache.hadoop.hive.ql.io.RCFileInputFormat

OutputFormat:           org.apache.hadoop.hive.ql.io.RCFileOutputFormat

Compressed:             No

Num Buckets:            256

Bucket Columns:         [order_id]

Sort Columns:           [Order(col:order_id, order:1)]

Storage Desc Params:

        escape.delim            \\

        field.delim             \t

        serialization.format    \t

Time taken: 1.737 seconds

=20

3.       -bash-4.1$ hadoop fs -du =
/user/hive/warehouse/orderdetailpartclust2;

299867901   =
hdfs://hadoop001:6931/user/hive/warehouse/orderdetailpartclust2/order_dat=
e=3D01-01-2008

.

.

.

311033139   =
hdfs://hadoop001:6931/user/hive/warehouse/orderdetailpartclust2/order_dat=
e=3D09-30-2008

4.       -bash-4.1$ hadoop fs -du =
/user/hive/warehouse/orderdetailpartclust2/order_date=3D09-30-2008;

Found 256 items

1213444     =
hdfs://hadoop001:6931/user/hive/warehouse/orderdetailpartclust2/order_dat=
e=3D09-30-2008/000000_0

.

.

.

1213166     =
hdfs://hadoop001:6931/user/hive/warehouse/orderdetailpartclust2/order_dat=
e=3D09-30-2008/000255_0

-bash-4.1$

5.       -bash-4.1$ hadoop fs -du =
/user/hive/warehouse/orderfactpartclust2;

Found 30 items

50943109    =
hdfs://hadoop001:6931/user/hive/warehouse/orderfactpartclust2/order_date=3D=
2008-09-01

.

.

.

50902368    =
hdfs://hadoop001:6931/user/hive/warehouse/orderfactpartclust2/order_date=3D=
2008-09-30

6.       bash-4.1$ hadoop fs -du =
/user/hive/warehouse/orderfactpartclust2/order_date=3D2008-09-30;

Found 256 items

198692      =
hdfs://hadoop001:6931/user/hive/warehouse/orderfactpartclust2/order_date=3D=
2008-09-30/000000_0

.

.

.

198954      =
hdfs://hadoop001:6931/user/hive/warehouse/orderfactpartclust2/order_date=3D=
2008-09-30/000255_0

=20

7.       -bash-4.1$ cat hive-site.xml

<?xml version=3D"1.0"?>

<?xml-stylesheet type=3D"text/xsl" href=3D"configuration.xsl"?>

=20

<configuration>

=20

<!-- Hive Configuration can either be stored in this file or in the =
hadoop configuration files  -->

<!-- that are implied by Hadoop setup variables.                         =
                       -->

<!-- Aside from Hadoop setup variables - this file is provided as a =
convenience so that Hive    -->

<!-- users do not have to edit hadoop configuration files (that may be =
managed as a centralized -->

<!-- resource).                                                          =
                       -->

=20

<!-- Hive Execution Parameters -->

=20

<property>

  <name>javax.jdo.option.ConnectionURL</name>

  <!-- jdbc:derby:/hadoophome/metastore_db;create=3Dtrue -->

  =
<value>jdbc:derby://hadoop010:1527/;databaseName=3Dmetastore_db;create=3D=
true</value>

  <description>JDBC connect string for a JDBC metastore</description>

</property>

=20

<property>

  <name>javax.jdo.option.ConnectionDriverName</name>

  <value>org.apache.derby.jdbc.EmbeddedDriver</value>

  <description>Driver class name for a JDBC metastore</description>

</property>

=20

<property>

  <name>hive.hwi.war.file</name>

  <value>/usr/lib/hive/lib/hive-hwi-0.7.0-cdh3u0.war</value>

  <description>This is the WAR file with the jsp content for Hive Web =
Interface</description>

</property>

=20

</configuration>

=20

8.       Performing Join

=20

hive> set hive.optimize.bucketmapjoin=3Dtrue;

hive> set hive.enforce.bucketing=3Dtrue;

hive> set =
hive.input.format=3Dorg.apache.hadoop.hive.ql.io.BucketizedHiveInputForma=
t;

hive> select /*+ MAPJOIN(orderfactpartclust2) */ a12.shipper_id, =
count(1), count (distinct a11.customer_id), sum(a11.qty_sold) from =
orderfactpartclust2 a12 join orderdetailpartclust2 a11 on (a11.order_id =
=3D a12.order_id) where (a11.order_date =3D '09-30-2008' and =
a12.order_date =3D '2008-09-30') group by a12.shipper_id;

Total MapReduce jobs =3D 2

Launching Job 1 out of 2

Number of reduce tasks not specified. Estimated from input data size: 1

In order to change the average load for a reducer (in bytes):

  set hive.exec.reducers.bytes.per.reducer=3D<number>

In order to limit the maximum number of reducers:

  set hive.exec.reducers.max=3D<number>

In order to set a constant number of reducers:

  set mapred.reduce.tasks=3D<number>

Starting Job =3D job_201202131643_1294, Tracking URL =3D =
http://hadoop001:50030/jobdetails.jsp?jobid=3Djob_201202131643_1294

Kill Command =3D /usr/lib/hadoop/bin/hadoop job  =
-Dmapred.job.tracker=3Dhadoop001:6932 -kill job_201202131643_1294

2012-04-10 16:15:06,663 Stage-1 map =3D 0%,  reduce =3D 0%

2012-04-10 16:15:08,671 Stage-1 map =3D 1%,  reduce =3D 0%

2012-04-10 16:15:09,675 Stage-1 map =3D 3%,  reduce =3D 0%

2012-04-10 16:15:10,679 Stage-1 map =3D 4%,  reduce =3D 0%

2012-04-10 16:15:11,683 Stage-1 map =3D 5%,  reduce =3D 0%

2012-04-10 16:15:12,688 Stage-1 map =3D 7%,  reduce =3D 0%

2012-04-10 16:15:13,692 Stage-1 map =3D 8%,  reduce =3D 0%

2012-04-10 16:15:14,697 Stage-1 map =3D 10%,  reduce =3D 0%

2012-04-10 16:15:15,756 Stage-1 map =3D 12%,  reduce =3D 0%

2012-04-10 16:15:16,761 Stage-1 map =3D 13%,  reduce =3D 0%

2012-04-10 16:15:17,767 Stage-1 map =3D 14%,  reduce =3D 0%

2012-04-10 16:15:18,773 Stage-1 map =3D 16%,  reduce =3D 0%

2012-04-10 16:15:19,778 Stage-1 map =3D 17%,  reduce =3D 1%

2012-04-10 16:15:20,784 Stage-1 map =3D 18%,  reduce =3D 1%

2012-04-10 16:15:21,789 Stage-1 map =3D 20%,  reduce =3D 1%

2012-04-10 16:15:22,795 Stage-1 map =3D 21%,  reduce =3D 5%

2012-04-10 16:15:23,800 Stage-1 map =3D 23%,  reduce =3D 5%

2012-04-10 16:15:24,805 Stage-1 map =3D 24%,  reduce =3D 5%

2012-04-10 16:15:25,936 Stage-1 map =3D 25%,  reduce =3D 8%

2012-04-10 16:15:26,941 Stage-1 map =3D 27%,  reduce =3D 8%

2012-04-10 16:15:27,947 Stage-1 map =3D 28%,  reduce =3D 8%

2012-04-10 16:15:28,951 Stage-1 map =3D 30%,  reduce =3D 8%

2012-04-10 16:15:29,956 Stage-1 map =3D 31%,  reduce =3D 8%

2012-04-10 16:15:30,981 Stage-1 map =3D 32%,  reduce =3D 8%

2012-04-10 16:15:31,987 Stage-1 map =3D 34%,  reduce =3D 8%

2012-04-10 16:15:32,992 Stage-1 map =3D 35%,  reduce =3D 10%

2012-04-10 16:15:33,998 Stage-1 map =3D 37%,  reduce =3D 10%

2012-04-10 16:15:35,003 Stage-1 map =3D 38%,  reduce =3D 10%

2012-04-10 16:15:36,055 Stage-1 map =3D 40%,  reduce =3D 10%

2012-04-10 16:15:37,097 Stage-1 map =3D 42%,  reduce =3D 10%

2012-04-10 16:15:38,102 Stage-1 map =3D 43%,  reduce =3D 10%

2012-04-10 16:15:39,108 Stage-1 map =3D 44%,  reduce =3D 10%

2012-04-10 16:15:40,113 Stage-1 map =3D 46%,  reduce =3D 10%

2012-04-10 16:15:41,123 Stage-1 map =3D 47%,  reduce =3D 10%

2012-04-10 16:15:42,128 Stage-1 map =3D 49%,  reduce =3D 15%

2012-04-10 16:15:43,134 Stage-1 map =3D 50%,  reduce =3D 15%

2012-04-10 16:15:44,139 Stage-1 map =3D 53%,  reduce =3D 15%

2012-04-10 16:15:46,152 Stage-1 map =3D 54%,  reduce =3D 15%

2012-04-10 16:15:47,158 Stage-1 map =3D 57%,  reduce =3D 15%

2012-04-10 16:15:48,164 Stage-1 map =3D 58%,  reduce =3D 15%

2012-04-10 16:15:49,171 Stage-1 map =3D 60%,  reduce =3D 15%

2012-04-10 16:15:50,176 Stage-1 map =3D 61%,  reduce =3D 15%

2012-04-10 16:15:51,182 Stage-1 map =3D 63%,  reduce =3D 19%

2012-04-10 16:15:52,199 Stage-1 map =3D 65%,  reduce =3D 19%

2012-04-10 16:15:53,222 Stage-1 map =3D 66%,  reduce =3D 19%

2012-04-10 16:15:54,228 Stage-1 map =3D 68%,  reduce =3D 19%

2012-04-10 16:15:55,234 Stage-1 map =3D 70%,  reduce =3D 19%

2012-04-10 16:15:56,241 Stage-1 map =3D 71%,  reduce =3D 19%

2012-04-10 16:15:57,248 Stage-1 map =3D 73%,  reduce =3D 21%

2012-04-10 16:15:58,253 Stage-1 map =3D 75%,  reduce =3D 21%

2012-04-10 16:15:59,260 Stage-1 map =3D 76%,  reduce =3D 21%

2012-04-10 16:16:00,267 Stage-1 map =3D 79%,  reduce =3D 21%

2012-04-10 16:16:01,273 Stage-1 map =3D 80%,  reduce =3D 21%

2012-04-10 16:16:02,280 Stage-1 map =3D 81%,  reduce =3D 21%

2012-04-10 16:16:03,287 Stage-1 map =3D 83%,  reduce =3D 27%

2012-04-10 16:16:04,294 Stage-1 map =3D 84%,  reduce =3D 27%

2012-04-10 16:16:05,302 Stage-1 map =3D 86%,  reduce =3D 27%

2012-04-10 16:16:06,310 Stage-1 map =3D 87%,  reduce =3D 27%

2012-04-10 16:16:07,317 Stage-1 map =3D 90%,  reduce =3D 27%

2012-04-10 16:16:08,325 Stage-1 map =3D 91%,  reduce =3D 27%

2012-04-10 16:16:09,332 Stage-1 map =3D 92%,  reduce =3D 27%

2012-04-10 16:16:10,339 Stage-1 map =3D 94%,  reduce =3D 27%

2012-04-10 16:16:11,348 Stage-1 map =3D 95%,  reduce =3D 27%

2012-04-10 16:16:12,355 Stage-1 map =3D 97%,  reduce =3D 29%

2012-04-10 16:16:13,362 Stage-1 map =3D 99%,  reduce =3D 29%

2012-04-10 16:16:14,370 Stage-1 map =3D 100%,  reduce =3D 29%

2012-04-10 16:16:18,396 Stage-1 map =3D 100%,  reduce =3D 32%

2012-04-10 16:16:24,654 Stage-1 map =3D 100%,  reduce =3D 67%

2012-04-10 16:16:27,683 Stage-1 map =3D 100%,  reduce =3D 70%

2012-04-10 16:16:30,701 Stage-1 map =3D 100%,  reduce =3D 73%

2012-04-10 16:16:33,719 Stage-1 map =3D 100%,  reduce =3D 77%

2012-04-10 16:16:36,739 Stage-1 map =3D 100%,  reduce =3D 80%

2012-04-10 16:16:39,781 Stage-1 map =3D 100%,  reduce =3D 84%

2012-04-10 16:16:42,806 Stage-1 map =3D 100%,  reduce =3D 88%

2012-04-10 16:16:45,824 Stage-1 map =3D 100%,  reduce =3D 92%

2012-04-10 16:16:48,840 Stage-1 map =3D 100%,  reduce =3D 97%

2012-04-10 16:16:50,854 Stage-1 map =3D 100%,  reduce =3D 100%

Ended Job =3D job_201202131643_1294

Launching Job 2 out of 2

Number of reduce tasks not specified. Estimated from input data size: 1

In order to change the average load for a reducer (in bytes):

  set hive.exec.reducers.bytes.per.reducer=3D<number>

In order to limit the maximum number of reducers:

  set hive.exec.reducers.max=3D<number>

In order to set a constant number of reducers:

  set mapred.reduce.tasks=3D<number>

Starting Job =3D job_201202131643_1295, Tracking URL =3D =
http://hadoop001:50030/jobdetails.jsp?jobid=3Djob_201202131643_1295

Kill Command =3D /usr/lib/hadoop/bin/hadoop job  =
-Dmapred.job.tracker=3Dhadoop001:6932 -kill job_201202131643_1295

2012-04-10 16:16:56,693 Stage-2 map =3D 0%,  reduce =3D 0%

2012-04-10 16:17:02,716 Stage-2 map =3D 100%,  reduce =3D 0%

2012-04-10 16:17:12,759 Stage-2 map =3D 100%,  reduce =3D 100%

Ended Job =3D job_201202131643_1295

OK

1       678832  67850   678832.0

2       1360529 135253  1360529.0

3       4784635 460994  4784635.0

Time taken: 131.748 seconds

hive>

From: Bejoy Ks [mailto:bejoy_ks@yahoo.com]=20
Sent: Tuesday, April 10, 2012 11:44 AM
To: user@hive.apache.org
Subject: [Marketing Mail] Re: Why BucketJoinMap consume too much memory

=20

Hi Binh

      You are right, here both of your tables are of the same size. And =
loading 2GB od data into hash tables and then to temp files and so on =
would take some time. This time becomes negligible if it was like, one =
table was of 2GB and other of 2TB, then you'll notice the wide =
difference in performance between a common join and bucketed map join.

      If one of the table is too small map join would be good, if it is =
of moderate size then bucketed map join.=20

=20

Regards

Bejoy KS

=20

  _____ =20

From: binhnt22 <Binhnt22@viettel.com.vn>
To: user@hive.apache.org=20
Cc: 'Bejoy Ks' <bejoy_ks@yahoo.com>=20
Sent: Tuesday, April 10, 2012 8:10 AM
Subject: RE: Why BucketJoinMap consume too much memory

=20

Hi Bejoy,

=20

It worked like a charm. Thank you very much. I really really appreciate =
your help.

=20

This bucket join should be used with 1 big table and 1 small table.=20

=20

If both table are big, the join time would be much more than normal =
join.

=20

Best regards

Nguyen Thanh Binh (Mr)

Cell phone: (+84)98.226.0622

=20

From: Bejoy Ks [mailto:bejoy_ks@yahoo.com]=20
Sent: Monday, April 09, 2012 9:49 PM
To: user@hive.apache.org
Subject: Re: Why BucketJoinMap consume too much memory

=20

Hi Binh

     It is just an issue with the number of buckets. Your tables has =
just 8 buckets, as there only 8 files are seen the storage directory. =
You might have just issued an ALTER TABLE script on an existing bucketed =
table. The work around here is

=20

1) You need to wipe and reload the tables with =
hive.enforce.bucketing=3Dtrue;

       Ensure your storage directory as that many files as the number of =
buckets. As per your table DDL you should see 256 files.

=20

2) Enable hive.optimize.bucketmapjoin =3D true; and try doing the join =
again.

=20

It should definitely work.

=20

Regards

Bejoy KS

=20

  _____ =20

From: binhnt22 <Binhnt22@viettel.com.vn>
To: user@hive.apache.org=20
Cc: 'Bejoy Ks' <bejoy_ks@yahoo.com>=20
Sent: Monday, April 9, 2012 8:42 AM
Subject: RE: Why BucketJoinMap consume too much memory

=20

Hi Bejoy,


Thank you for helping me. Here is the information=20

=20

1.      Describe Formatted ra_md_syn;

# col_name              data_type               comment

=20

calling                 string                  None

total_duration          bigint                  None

total_volume            bigint                  None

total_charge            bigint                  None

=20

# Detailed Table Information

Database:               default

Owner:                  hduser

CreateTime:             Thu Apr 05 09:48:29 ICT 2012

LastAccessTime:         UNKNOWN

Protect Mode:           None

Retention:              0

Location:               =
hdfs://master:54310/user/hive/warehouse/ra_md_syn

Table Type:             MANAGED_TABLE

Table Parameters:

        numFiles                8

        numPartitions           0

        numRows                 0

        rawDataSize             0

        totalSize               1872165483

        transient_lastDdlTime   1333595095

=20

# Storage Information

SerDe Library:          =
org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe

InputFormat:            org.apache.hadoop.mapred.TextInputFormat

OutputFormat:           =
org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputForm                 =
  at

Compressed:             No

Num Buckets:            256

Bucket Columns:         [calling]

Sort Columns:           []

Storage Desc Params:

        serialization.format    1

=20

2.      Describe Formatted ra_ocs_syn;

# col_name              data_type               comment

=20

calling                 string                  None

total_duration          bigint                  None

total_volume            bigint                  None

total_charge            bigint                  None

=20

# Detailed Table Information

Database:               default

Owner:                  hduser

CreateTime:             Thu Apr 05 09:48:24 ICT 2012

LastAccessTime:         UNKNOWN

Protect Mode:           None

Retention:              0

Location:               =
hdfs://master:54310/user/hive/warehouse/ra_ocs_syn

Table Type:             MANAGED_TABLE

Table Parameters:

        numFiles                8

        numPartitions           0

        numRows                 0

        rawDataSize             0

        totalSize               1872162225

        transient_lastDdlTime   1333595512

=20

# Storage Information

SerDe Library:          =
org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe

InputFormat:            org.apache.hadoop.mapred.TextInputFormat

OutputFormat:           =
org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat

Compressed:             No

Num Buckets:            256

Bucket Columns:         [calling]

Sort Columns:           []

Storage Desc Params:

        serialization.format    1

=20

3.      hadoop fs -du <hdfs location of ra_md_syn >

[hduser@master hadoop-0.20.203.0]$ bin/hadoop fs -du =
/user/hive/warehouse/ra_md_syn

Found 8 items

280371407   hdfs://master:54310/user/hive/warehouse/ra_md_syn/000000_1

280371407   hdfs://master:54310/user/hive/warehouse/ra_md_syn/000001_0

274374970   hdfs://master:54310/user/hive/warehouse/ra_md_syn/000002_1

274374970   hdfs://master:54310/user/hive/warehouse/ra_md_syn/000003_1

269949415   hdfs://master:54310/user/hive/warehouse/ra_md_syn/000004_0

262439067   hdfs://master:54310/user/hive/warehouse/ra_md_syn/000005_0

205767721   hdfs://master:54310/user/hive/warehouse/ra_md_syn/000006_0

24516526    hdfs://master:54310/user/hive/warehouse/ra_md_syn/000007_0

=20

4.      hadoop fs -du <hdfs location of  ra_ocs_syn >

[hduser@master hadoop-0.20.203.0]$ bin/hadoop fs -du =
/user/hive/warehouse/ra_ocs_syn

Found 8 items

314639270   hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000000_0

314639270   hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000001_0

304959363   hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000002_0

274374381   hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000003_1

264694474   hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000004_0

257498693   hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000005_1

100334604   hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000006_0

41022170    hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000007_0

=20

5.      hive-site.xml

[hduser@master ~]$ cat hive-0.8.1/conf/hive-site.xml

<?xml version=3D"1.0"?>

<?xml-stylesheet type=3D"text/xsl" href=3D"configuration.xsl"?>

=20

<configuration>

        <property>

                <name>hive.metastore.local</name>

                <value>true</value>

        </property>

        <property>

        <name>javax.jdo.option.ConnectionURL</name>

        =
<value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=3Dtrue</=
value>

        </property>

        <property>

        <name>javax.jdo.option.ConnectionDriverName</name>

        <value>com.mysql.jdbc.Driver</value>

        </property>

        <property>

        <name>javax.jdo.option.ConnectionUserName</name>

        <value>hadoop</value>

        </property>

        <property>

        <name>javax.jdo.option.ConnectionPassword</name>

        <value>hadoop</value>

        </property>

=20

=20

        <property>

          <name>hive.metastore.sasl.enabled</name>

          <value>true</value>

          <description>If true, the metastore thrift interface will be =
secured with SASL. Clients must authenticate with =
Kerberos.</description>

        </property>

=20

        <property>

          <name>hive.metastore.kerberos.keytab.file</name>

          <value></value>

          <description>The path to the Kerberos Keytab file containing =
the metastore thrift server's service principal.</description>

        </property>

=20

        <property>

          <name>hive.metastore.kerberos.principal</name>

          <value>hduser/admin@EXAMPLE.COM =
<mailto:hduser/admin@EXAMPLE.COM%3c/value> </value>

          <description>The service principal for the metastore thrift =
server. The special string _HOST will be replaced automatically with the =
correct host name.</description>

        </property>

</configuration>

=20

6.      Performing JOIN

hive> set hive.optimize.bucketmapjoin =3D true;

hive> set hive.enforce.bucketing=3Dtrue;

hive> set =
hive.input.format=3Dorg.apache.hadoop.hive.ql.io.BucketizedHiveInputForma=
t;

hive> select /*+ MAPJOIN(b) */ * from ra_md_syn a join ra_ocs_syn b

    > on (a.calling =3D b.calling) where  a.total_volume <> =
b.total_volume;

Total MapReduce jobs =3D 1

WARNING: org.apache.hadoop.metrics.jvm.EventCounter is deprecated. =
Please use org.apache.hadoop.log.metrics.EventCounter in all the =
log4j.properties files.

Execution log at: =
/tmp/hduser/hduser_20120409013131_da40d787-597d-490c-8558-9d10ec11e916.lo=
g

2012-04-09 01:31:24     Starting to launch local task to process map =
join;      maximum memory =3D 13                           98145024

2012-04-09 01:31:28     Processing rows:        200000  Hashtable size: =
199999  Memory usage:   754                           05504   rate:   =
0.054

2012-04-09 01:31:29     Processing rows:        300000  Hashtable size: =
299999  Memory usage:   111                           540296  rate:   =
0.08

2012-04-09 01:31:32     Processing rows:        400000  Hashtable size: =
399999  Memory usage:   151                           640080  rate:   =
0.108

2012-04-09 01:31:35     Processing rows:        500000  Hashtable size: =
499999  Memory usage:   185                           503416  rate:   =
0.133

2012-04-09 01:31:37     Processing rows:        600000  Hashtable size: =
599999  Memory usage:   221                           503440  rate:   =
0.158

2012-04-09 01:31:42     Processing rows:        700000  Hashtable size: =
699999  Memory usage:   257                           484264  rate:   =
0.184

2012-04-09 01:31:47     Processing rows:        800000  Hashtable size: =
799999  Memory usage:   297                           678568  rate:   =
0.213

2012-04-09 01:31:52     Processing rows:        900000  Hashtable size: =
899999  Memory usage:   333                           678592  rate:   =
0.239

2012-04-09 01:31:57     Processing rows:        1000000 Hashtable size: =
999999  Memory usage:   369                           678568  rate:   =
0.264

2012-04-09 01:32:03     Processing rows:        1100000 Hashtable size: =
1099999 Memory usage:   405                           678568  rate:   =
0.29

2012-04-09 01:32:09     Processing rows:        1200000 Hashtable size: =
1199999 Memory usage:   441                           678592  rate:   =
0.316

2012-04-09 01:32:15     Processing rows:        1300000 Hashtable size: =
1299999 Memory usage:   477                           678568  rate:   =
0.342

2012-04-09 01:32:23     Processing rows:        1400000 Hashtable size: =
1399999 Memory usage:   513                           678592  rate:   =
0.367

2012-04-09 01:32:29     Processing rows:        1500000 Hashtable size: =
1499999 Memory usage:   549                           678568  rate:   =
0.393

2012-04-09 01:32:35     Processing rows:        1600000 Hashtable size: =
1599999 Memory usage:   602                           455824  rate:   =
0.431

2012-04-09 01:32:45     Processing rows:        1700000 Hashtable size: =
1699999 Memory usage:   630                           067176  rate:   =
0.451

2012-04-09 01:32:53     Processing rows:        1800000 Hashtable size: =
1799999 Memory usage:   666                           067176  rate:   =
0.476

2012-04-09 01:33:01     Processing rows:        1900000 Hashtable size: =
1899999 Memory usage:   702                           067200  rate:   =
0.502

2012-04-09 01:33:09     Processing rows:        2000000 Hashtable size: =
1999999 Memory usage:   738                           067176  rate:   =
0.528

2012-04-09 01:33:20     Processing rows:        2100000 Hashtable size: =
2099999 Memory usage:   774                           254456  rate:   =
0.554

2012-04-09 01:33:29     Processing rows:        2200000 Hashtable size: =
2199999 Memory usage:   810                           067176  rate:   =
0.579

2012-04-09 01:33:38     Processing rows:        2300000 Hashtable size: =
2299999 Memory usage:   846                           568480  rate:   =
0.605

2012-04-09 01:33:49     Processing rows:        2400000 Hashtable size: =
2399999 Memory usage:   882                           096752  rate:   =
0.631

2012-04-09 01:33:59     Processing rows:        2500000 Hashtable size: =
2499999 Memory usage:   918                           821920  rate:   =
0.657

2012-04-09 01:34:15     Processing rows:        2600000 Hashtable size: =
2599999 Memory usage:   954                           134920  rate:   =
0.682

2012-04-09 01:34:26     Processing rows:        2700000 Hashtable size: =
2699999 Memory usage:   990                           067168  rate:   =
0.708

2012-04-09 01:34:38     Processing rows:        2800000 Hashtable size: =
2799999 Memory usage:   102                           7113288 rate:   =
0.735

Exception in thread "Thread-2" java.lang.OutOfMemoryError: Java heap =
space

        at java.util.Arrays.copyOf(Arrays.java:2882)

        at =
java.lang.AbstractStringBuilder.expandCapacity(AbstractStringBuilder.java=
:100)

        at =
java.lang.AbstractStringBuilder.append(AbstractStringBuilder.java:597)

        at java.lang.StringBuilder.append(StringBuilder.java:212)

        at org.apache.hadoop.fs.FileSystem.closeAll(FileSystem.java:247)

        at =
org.apache.hadoop.fs.FileSystem$ClientFinalizer.run(FileSystem.java:232)

Exception in thread "Thread-1" java.lang.OutOfMemoryError: Java heap =
space

        at =
java.util.jar.Manifest$FastInputStream.<init>(Manifest.java:315)

        at =
java.util.jar.Manifest$FastInputStream.<init>(Manifest.java:310)

        at java.util.jar.Manifest.read(Manifest.java:178)

        at java.util.jar.Manifest.<init>(Manifest.java:52)

        at =
java.util.jar.JarFile.getManifestFromReference(JarFile.java:167)

        at java.util.jar.JarFile.getManifest(JarFile.java:148)

        at =
sun.misc.URLClassPath$JarLoader$2.getManifest(URLClassPath.java:696)

        at java.net.URLClassLoader.defineClass(URLClassLoader.java:228)

        at java.net.URLClassLoader.access$000(URLClassLoader.java:58)

        at java.net.URLClassLoader$1.run(URLClassLoader.java:197)

        at java.security.AccessController.doPrivileged(Native Method)

        at java.net.URLClassLoader.findClass(URLClassLoader.java:190)

        at java.lang.ClassLoader.loadClass(ClassLoader.java:306)

        at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:301)

        at java.lang.ClassLoader.loadClass(ClassLoader.java:247)

        at org.apache.hadoop.util.RunJar$1.run(RunJar.java:126)

Execution failed with exit status: 2

Obtaining error information

=20

Task failed!

Task ID:

  Stage-3

=20

Logs:

=20

/tmp/hduser/hive.log

FAILED: Execution Error, return code 2 from =
org.apache.hadoop.hive.ql.exec.MapredLocalTask

7.      /tmp/hduser/hive.log

2012-04-09 02:00:10,654 ERROR DataNucleus.Plugin =
(Log4JLogger.java:error(115)) - Bundle "org.eclipse.jdt.core" requires =
"org.eclipse.core.resources" but it cannot be resolved.

2012-04-09 02:00:10,654 ERROR DataNucleus.Plugin =
(Log4JLogger.java:error(115)) - Bundle "org.eclipse.jdt.core" requires =
"org.eclipse.core.resources" but it cannot be resolved.

2012-04-09 02:00:10,657 ERROR DataNucleus.Plugin =
(Log4JLogger.java:error(115)) - Bundle "org.eclipse.jdt.core" requires =
"org.eclipse.core.runtime" but it cannot be resolved.

2012-04-09 02:00:10,657 ERROR DataNucleus.Plugin =
(Log4JLogger.java:error(115)) - Bundle "org.eclipse.jdt.core" requires =
"org.eclipse.core.runtime" but it cannot be resolved.

2012-04-09 02:00:10,657 ERROR DataNucleus.Plugin =
(Log4JLogger.java:error(115)) - Bundle "org.eclipse.jdt.core" requires =
"org.eclipse.text" but it cannot be resolved.

2012-04-09 02:00:10,657 ERROR DataNucleus.Plugin =
(Log4JLogger.java:error(115)) - Bundle "org.eclipse.jdt.core" requires =
"org.eclipse.text" but it cannot be resolved.

2012-04-09 02:00:12,796 WARN  parse.SemanticAnalyzer =
(SemanticAnalyzer.java:genBodyPlan(5821)) - Common Gby keys:null

2012-04-09 02:09:02,356 ERROR exec.Task =
(SessionState.java:printError(380)) - Execution failed with exit status: =
2

2012-04-09 02:09:02,357 ERROR exec.Task =
(SessionState.java:printError(380)) - Obtaining error information

2012-04-09 02:09:02,358 ERROR exec.Task =
(SessionState.java:printError(380)) -

Task failed!

Task ID:

  Stage-3

=20

Logs:

=20

2012-04-09 02:09:02,358 ERROR exec.Task =
(SessionState.java:printError(380)) - /tmp/hduser/hive.log

2012-04-09 02:09:02,359 ERROR exec.MapredLocalTask =
(MapredLocalTask.java:execute(228)) - Execution failed with exit status: =
2

2012-04-09 02:09:02,377 ERROR ql.Driver =
(SessionState.java:printError(380)) - FAILED: Execution Error, return =
code 2 from org.apache.hadoop.hive.ql.exec.MapredLocalTask

=20

=20

Best regards

Nguyen Thanh Binh (Mr)

Cell phone: (+84)98.226.0622

=20

From: Bejoy Ks [mailto:bejoy_ks@yahoo.com]=20
Sent: Friday, April 06, 2012 11:33 PM
To: user@hive.apache.org
Subject: Re: Why BucketJoinMap consume too much memory

=20

Hi Binh,

        From the information you provided bucketed map join should be =
posible. I'm clueless now, but still I can make one more try, if you =
could provide me the output of the following

=20

1) Describe Formatted ra_md_syn;

2) Describe Formatted ra_ocs_syn.

=20

3) hadoop fs -du <hdfs location of ra_ocs_syn >

4) hadoop fs -du <hdfs location of  ra_md_syn >

=20

5) perform the join and paste the full console log along with the query. =
(with all the properties set at CLI)

=20

6) your hive-site.xml

=20

@Alex

       You can use non equality conditions in the where clause. Only the =
ON conditions should be equality ones.

=20

=20

Regards

Bejoy KS

=20

=20

  _____ =20

From: gemini alex <gemini5201314@gmail.com>
To: user@hive.apache.org=20
Cc: Bejoy Ks <bejoy_ks@yahoo.com>=20
Sent: Friday, April 6, 2012 12:36 PM
Subject: Re: Why BucketJoinMap consume too much memory

=20

I guess the problem is you can't using <> predicate in bucket join, try =
to=20

select c.* from (

select /*+ MAPJOIN(b) */ a.calling calling ,a. total_volume =
atotal_volume , b.total_volume btotal_volume from ra_md_syn a join =
ra_ocs_syn b

     on (a.calling =3D b.calling) ) c where =
c.atotal_volumn<>c.btotal_volume ;

=20

=20

=20

=E5=9C=A8 2012=E5=B9=B44=E6=9C=886=E6=97=A5 =
=E4=B8=8A=E5=8D=889:19=EF=BC=8Cbinhnt22 =
<Binhnt22@viettel.com.vn>=E5=86=99=E9=81=93=EF=BC=9A

Hi Bejoy,

=20

Sorry for late response. I will start to demonstrate over again to clear =
some information.

=20

I have 2 tables, nearly same. Both has the same table structure, 65m =
records, 2GB size (same size).

hive> describe ra_md_syn;

OK

calling string

total_duration  bigint

total_volume    bigint

total_charge    bigint

=20

Both of them were bucketized into 256 buckets on =
=E2=80=98calling=E2=80=99 column (in the last time only 10 buckets, I =
tried to increase it as you suggested). And I want to find all =
=E2=80=98calling=E2=80=99 exists in both tables but different =
=E2=80=98total_volume=E2=80=99

The script as you knew:

=20

hive> set hive.optimize.bucketmapjoin =3D true;

hive> set hive.enforce.bucketing=3Dtrue;

hive> set =
hive.input.format=3Dorg.apache.hadoop.hive.ql.io.CombineHiveInputFormat;

hive> select /*+ MAPJOIN(b) */ * from ra_md_syn a join ra_ocs_syn b

    > on (a.calling =3D b.calling) where  a.total_volume <> =
b.total_volume;

=20

And the result was exactly in my last email. Java heap space error. With =
total size is only 2GB and 256 buckets, I think bucket size is =
impossible to be the issue here.

=20

Please give me some advice, I really appreciate

Best regards

Nguyen Thanh Binh (Mr)

Cell phone: (+84)98.226.0622

=20

From: Bejoy Ks [mailto:bejoy_ks@yahoo.com]=20
Sent: Thursday, April 05, 2012 7:23 PM


To: user@hive.apache.org
Subject: Re: Why BucketJoinMap consume too much memory

=20

Hi Binh

=20

    I was just checking your local map join log , and I noticed two =
things=20

- the memory usage by one hash table has got beyond 1G.=20

- Number of rows processed is just 2M

=20

It is possible that, Each bucket it self is too large to be loaded in =
memory.

=20

As a work around or to nail down the bucket size is the issue here, can =
you try increasing the number of buckets to 100 and try doing a bucketed =
map join.

=20

Also you mentioned the data size is 2Gb, is it the compressed data size?

=20

2012-04-05 10:41:07     Processing rows:        2,900,000 Hashtable =
size: 2899999 Memory usage:   1,062,065,576      rate:   0.76

=20

Regards

Bejoy KS

=20

=20

=20

  _____ =20

From: Nitin Pawar <nitinpawar432@gmail.com>
To: user@hive.apache.org=20
Sent: Thursday, April 5, 2012 5:03 PM
Subject: Re: Why BucketJoinMap consume too much memory

=20

Can you tell me the size of table b?=20

=20

If you are doing bucketing and still size b table is huge then it will =
reach this problem

On Thu, Apr 5, 2012 at 4:22 PM, binhnt22 <Binhnt22@viettel.com.vn> =
wrote:

Thank Nitin,

=20

I tried but no luck. Here=E2=80=99s hive log, please spend a little time =
to view it.

=20

hive> set hive.optimize.bucketmapjoin =3D true;

hive> set hive.enforce.bucketing=3Dtrue;

hive> set =
hive.input.format=3Dorg.apache.hadoop.hive.ql.io.CombineHiveInputFormat;

hive> select /*+ MAPJOIN(b) */ * from ra_md_syn a join ra_ocs_syn b

    > on (a.calling =3D b.calling) where  a.total_volume <> =
b.total_volume;

Total MapReduce jobs =3D 1

WARNING: org.apache.hadoop.metrics.jvm.EventCounter is deprecated. =
Please use org.apache.hadoop.log.metrics.EventCounter in all the =
log4j.properties files.

Execution log at: =
/tmp/hduser/hduser_20120405103737_28ef26fe-a202-4047-b5ca-c40d9e3ad36c.lo=
g

2012-04-05 10:37:45     Starting to launch local task to process map =
join;      maximum memory =3D 1398145024

2012-04-05 10:37:48     Processing rows:        200000  Hashtable size: =
199999  Memory usage:   75403880        rate:   0.054

2012-04-05 10:37:50     Processing rows:        300000  Hashtable size: =
299999  Memory usage:   111404664       rate:   0.08

2012-04-05 10:37:54     Processing rows:        400000  Hashtable size: =
399999  Memory usage:   151598960       rate:   0.108

2012-04-05 10:38:04     Processing rows:        500000  Hashtable size: =
499999  Memory usage:   185483368       rate:   0.133

2012-04-05 10:38:09     Processing rows:        600000  Hashtable size: =
599999  Memory usage:   221483392       rate:   0.158

2012-04-05 10:38:13     Processing rows:        700000  Hashtable size: =
699999  Memory usage:   257482640       rate:   0.184

2012-04-05 10:38:19     Processing rows:        800000  Hashtable size: =
799999  Memory usage:   297676944       rate:   0.213

2012-04-05 10:38:22     Processing rows:        900000  Hashtable size: =
899999  Memory usage:   333676968       rate:   0.239

2012-04-05 10:38:27     Processing rows:        1000000 Hashtable size: =
999999  Memory usage:   369676944       rate:   0.264

2012-04-05 10:38:31     Processing rows:        1100000 Hashtable size: =
1099999 Memory usage:   405676968       rate:   0.29

2012-04-05 10:38:36     Processing rows:        1200000 Hashtable size: =
1199999 Memory usage:   441676944       rate:   0.316

2012-04-05 10:38:42     Processing rows:        1300000 Hashtable size: =
1299999 Memory usage:   477676944       rate:   0.342

2012-04-05 10:38:47     Processing rows:        1400000 Hashtable size: =
1399999 Memory usage:   513676968       rate:   0.367

2012-04-05 10:38:52     Processing rows:        1500000 Hashtable size: =
1499999 Memory usage:   549676944       rate:   0.393

2012-04-05 10:39:00     Processing rows:        1600000 Hashtable size: =
1599999 Memory usage:   602454200       rate:   0.431

2012-04-05 10:39:08     Processing rows:        1700000 Hashtable size: =
1699999 Memory usage:   630065552       rate:   0.451

2012-04-05 10:39:14     Processing rows:        1800000 Hashtable size: =
1799999 Memory usage:   666065552       rate:   0.476

2012-04-05 10:39:20     Processing rows:        1900000 Hashtable size: =
1899999 Memory usage:   702065552       rate:   0.502

2012-04-05 10:39:26     Processing rows:        2000000 Hashtable size: =
1999999 Memory usage:   738065576       rate:   0.528

2012-04-05 10:39:36     Processing rows:        2100000 Hashtable size: =
2099999 Memory usage:   774065552       rate:   0.554

2012-04-05 10:39:43     Processing rows:        2200000 Hashtable size: =
2199999 Memory usage:   810065552       rate:   0.579

2012-04-05 10:39:51     Processing rows:        2300000 Hashtable size: =
2299999 Memory usage:   846065576       rate:   0.605

2012-04-05 10:40:16     Processing rows:        2400000 Hashtable size: =
2399999 Memory usage:   882085136       rate:   0.631

2012-04-05 10:40:24     Processing rows:        2500000 Hashtable size: =
2499999 Memory usage:   918085208       rate:   0.657

2012-04-05 10:40:39     Processing rows:        2600000 Hashtable size: =
2599999 Memory usage:   954065544       rate:   0.682

2012-04-05 10:40:48     Processing rows:        2700000 Hashtable size: =
2699999 Memory usage:   990065568       rate:   0.708

2012-04-05 10:40:56     Processing rows:        2800000 Hashtable size: =
2799999 Memory usage:   1026065552      rate:   0.734

2012-04-05 10:41:07     Processing rows:        2900000 Hashtable size: =
2899999 Memory usage:   1062065576      rate:   0.76

Exception in thread "Thread-1" java.lang.OutOfMemoryError: Java heap =
space

=20

Best regards

Nguyen Thanh Binh (Mr)

Cell phone: (+84)98.226.0622

=20

From: Nitin Pawar [mailto:nitinpawar432@gmail.com]=20
Sent: Thursday, April 05, 2012 5:36 PM


To: user@hive.apache.org
Subject: Re: Why BucketJoinMap consume too much memory

=20

can you try adding these settings=20

set hive.enforce.bucketing=3Dtrue;

hive.input.format=3Dorg.apache.hadoop.hive.ql.io.CombineHiveInputFormat;

=20

I have tried bucketing with 1000 buckets and with more than 1TB data =
tables .. they do go through fine=20

=20

=20

On Thu, Apr 5, 2012 at 3:37 PM, binhnt22 <Binhnt22@viettel.com.vn> =
wrote:

Hi Bejoy,

=20

Both my tables has 65m records ( ~ 1.8-1.9GB on hadoop) and bucketized =
on =E2=80=98calling=E2=80=99 column into 10 buckets.

=20

As you said, hive will load only 1 bucket ~ 180-190MB into memory. =
That=E2=80=99s hardly to blow the heap (1.3GB)

=20

According to wiki, I set:

=20

  set =
hive.input.format=3Dorg.apache.hadoop.hive.ql.io.BucketizedHiveInputForma=
t;

  set hive.optimize.bucketmapjoin =3D true;

  set hive.optimize.bucketmapjoin.sortedmerge =3D true;

=20

And run the following SQL

=20

select /*+ MAPJOIN(a) */ * from ra_md_cdr_ggsn_synthetic a join =
ra_ocs_cdr_ggsn_synthetic b=20

on (a.calling =3D b.calling) where  a.total_volume <> b.total_volume;

=20

But it still created many hash tables then threw Java Heap space error

=20

Best regards

Nguyen Thanh Binh (Mr)

Cell phone: (+84)98.226.0622

=20

From: Bejoy Ks [mailto:bejoy_ks@yahoo.com]=20
Sent: Thursday, April 05, 2012 3:07 PM
To: user@hive.apache.org


Subject: Re: Why BucketJoinMap consume too much memory

=20

Hi Amit

=20

      Sorry for the delayed response, had a terrible schedule. AFAIK, =
there is no flags that would help you to take the hash table creation, =
compression and load into tmp files away from client node.=20

      From my understanding if you use a Map side join, the small table =
as a whole is converted into a hash table and compressed in a tmp file. =
Say if your child jvm size is 1gb and this small table is 5GB, it'd blow =
off jour job if the map tasks tries to get such a huge file in memory. =
Bucketed map join can help here, if the table is bucketed ,say 100 =
buckets then each bucket may have around 50mb of data. ie one tmp file =
would be just less that 50mb, here mapper needs to load only the =
required buckets in memory and thus hardly run into memory issues.

    Also on the client, The records are processed bucket by bucket and =
loaded into tmp files. So if your bucket size is too large, than the =
heap size specified for your client, it'd throw an out of memory.

=20

Regards

Bejoy KS

=20

  _____ =20

From: Amit Sharma <amitsharma1708@gmail.com>
To: user@hive.apache.org; Bejoy Ks <bejoy_ks@yahoo.com>=20
Sent: Tuesday, April 3, 2012 11:06 PM
Subject: Re: Why BucketJoinMap consume too much memory

=20

I am experiencing similar behavior in my queries. All the conditions for =
bucketed map join are met, and the only difference in execution when i =
set the hive.optimize.bucketmapjoin flag to true, is that instead of a =
single hash table, multiple hash tables are created. All the Hash Tables =
are still created on the client side and loaded into tmp files, which =
are then distributed to the mappers using distributed cache.

Can i find any example anywhere, which shows behavior of bucketed map =
join, where in it does not create the has tables on the client itself? =
If so, is there a flag for it?

Thanks,
Amit

On Sun, Apr 1, 2012 at 12:35 PM, Bejoy Ks <bejoy_ks@yahoo.com> wrote:

Hi
    On a first look, it seems like map join is happening in your case =
other than bucketed map join. The following conditions need to hold for =
bucketed map join to work
1) Both the tables are bucketed on the join columns
2) The number of buckets in each table should be multiples of each other
3) Ensure that the table has enough number of buckets=20

Note: If the data is large say 1TB(per table) and if you have just a few =
buckets say 100 buckets, each mapper may have to load 10GB>. This would =
definitely blow your jvm . Bottom line is ensure your mappers are not =
heavily loaded with the bucketed data distribution.

Regards
Bejoy.K.S

  _____ =20

From: binhnt22 <Binhnt22@viettel.com.vn>
To: user@hive.apache.org=20
Sent: Saturday, March 31, 2012 6:46 AM
Subject: Why BucketJoinMap consume too much memory

=20

I  have 2 table, each has 6 million records and clustered into 10 =
buckets

=20

These tables are very simple with 1 key column and 1 value column, all I =
want is getting the key that exists in both table but different value.

=20

The normal did the trick, took only 141 secs.

=20

select * from ra_md_cdr_ggsn_synthetic a join ra_ocs_cdr_ggsn_synthetic =
b on (a.calling =3D b.calling) where  a.total_volume <> b.total_volume;

=20

I tried to use bucket join map by setting:   set =
hive.optimize.bucketmapjoin =3D true

=20

select /*+ MAPJOIN(a) */ * from ra_md_cdr_ggsn_synthetic a join =
ra_ocs_cdr_ggsn_synthetic b on (a.calling =3D b.calling) where  =
a.total_volume <> b.total_volume;

=20

2012-03-30 11:35:09     Starting to launch local task to process map =
join;      maximum memory =3D 1398145024

2012-03-30 11:35:12     Processing rows:        200000  Hashtable size: =
199999  Memory usage:   86646704        rate:   0.062

2012-03-30 11:35:15     Processing rows:        300000  Hashtable size: =
299999  Memory usage:   128247464       rate:   0.092

2012-03-30 11:35:18     Processing rows:        400000  Hashtable size: =
399999  Memory usage:   174041744       rate:   0.124

2012-03-30 11:35:21     Processing rows:        500000  Hashtable size: =
499999  Memory usage:   214140840       rate:   0.153

2012-03-30 11:35:25     Processing rows:        600000  Hashtable size: =
599999  Memory usage:   255181504       rate:   0.183

2012-03-30 11:35:29     Processing rows:        700000  Hashtable size: =
699999  Memory usage:   296744320       rate:   0.212

2012-03-30 11:35:35     Processing rows:        800000  Hashtable size: =
799999  Memory usage:   342538616       rate:   0.245

2012-03-30 11:35:38     Processing rows:        900000  Hashtable size: =
899999  Memory usage:   384138552       rate:   0.275

2012-03-30 11:35:45     Processing rows:        1000000 Hashtable size: =
999999  Memory usage:   425719576       rate:   0.304

2012-03-30 11:35:50     Processing rows:        1100000 Hashtable size: =
1099999 Memory usage:   467319576       rate:   0.334

2012-03-30 11:35:56     Processing rows:        1200000 Hashtable size: =
1199999 Memory usage:   508940504       rate:   0.364

2012-03-30 11:36:04     Processing rows:        1300000 Hashtable size: =
1299999 Memory usage:   550521128       rate:   0.394

2012-03-30 11:36:09     Processing rows:        1400000 Hashtable size: =
1399999 Memory usage:   592121128       rate:   0.424

2012-03-30 11:36:15     Processing rows:        1500000 Hashtable size: =
1499999 Memory usage:   633720336       rate:   0.453

2012-03-30 11:36:22     Processing rows:        1600000 Hashtable size: =
1599999 Memory usage:   692097568       rate:   0.495

2012-03-30 11:36:33     Processing rows:        1700000 Hashtable size: =
1699999 Memory usage:   725308944       rate:   0.519

2012-03-30 11:36:40     Processing rows:        1800000 Hashtable size: =
1799999 Memory usage:   766946424       rate:   0.549

2012-03-30 11:36:48     Processing rows:        1900000 Hashtable size: =
1899999 Memory usage:   808527928       rate:   0.578

2012-03-30 11:36:55     Processing rows:        2000000 Hashtable size: =
1999999 Memory usage:   850127928       rate:   0.608

2012-03-30 11:37:08     Processing rows:        2100000 Hashtable size: =
2099999 Memory usage:   891708856       rate:   0.638

2012-03-30 11:37:16     Processing rows:        2200000 Hashtable size: =
2199999 Memory usage:   933308856       rate:   0.668

2012-03-30 11:37:25     Processing rows:        2300000 Hashtable size: =
2299999 Memory usage:   974908856       rate:   0.697

2012-03-30 11:37:34     Processing rows:        2400000 Hashtable size: =
2399999 Memory usage:   1016529448      rate:   0.727

2012-03-30 11:37:43     Processing rows:        2500000 Hashtable size: =
2499999 Memory usage:   1058129496      rate:   0.757

2012-03-30 11:37:58     Processing rows:        2600000 Hashtable size: =
2599999 Memory usage:   1099708832      rate:   0.787

Exception in thread "Thread-1" java.lang.OutOfMemoryError: Java heap =
space

=20

My system has 4 PC, each has CPU E2180, 2GB ram, 80GB HDD, one of them =
containts NameNode, JobTracker, Hive Server and all of them contain =
DataNode, TaskTracker

=20

In all node, I set: export HADOOP_HEAPSIZE=3D1500 in hadoop-env.sh (~ =
1.3GB heap)

=20

I want to ask you experts, why bucket join map consume too much memory? =
Am I wrong or my configuration is bad?

=20

Best regards,

=20

=20

=20

=20


=20

--=20
Nitin Pawar


=20

--=20
Nitin Pawar

=20

=20

=20

=20

=20


--Boundary_(ID_Xs6DU59ehoTRUXpe5DR+0g)
Content-type: text/html; charset=utf-8
Content-transfer-encoding: quoted-printable

<html xmlns:v=3D"urn:schemas-microsoft-com:vml" =
xmlns:o=3D"urn:schemas-microsoft-com:office:office" =
xmlns:w=3D"urn:schemas-microsoft-com:office:word" =
xmlns:m=3D"http://schemas.microsoft.com/office/2004/12/omml" =
xmlns=3D"http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=3DContent-Type content=3D"text/html; charset=3Dutf-8">
<meta name=3DGenerator content=3D"Microsoft Word 12 (filtered medium)">
<!--[if !mso]>
<style>
v\:* {behavior:url(#default#VML);}
o\:* {behavior:url(#default#VML);}
w\:* {behavior:url(#default#VML);}
.shape {behavior:url(#default#VML);}
</style>
<![endif]-->
<style>
<!--
 /* Font Definitions */
 @font-face
	{font-family:"MS Mincho";
	panose-1:2 2 6 9 4 2 5 8 3 4;}
@font-face
	{font-family:"Cambria Math";
	panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
	{font-family:Calibri;
	panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
	{font-family:Tahoma;
	panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
	{font-family:"\@MS Mincho";
	panose-1:2 2 6 9 4 2 5 8 3 4;}
@font-face
	{font-family:Verdana;
	panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
	{font-family:"Arial Narrow";
	panose-1:2 11 6 6 2 2 2 3 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
	{margin:0in;
	margin-bottom:.0001pt;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
	{mso-style-priority:99;
	color:blue;
	text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
	{mso-style-priority:99;
	color:purple;
	text-decoration:underline;}
p.MsoAcetate, li.MsoAcetate, div.MsoAcetate
	{mso-style-priority:99;
	mso-style-link:"Balloon Text Char";
	margin:0in;
	margin-bottom:.0001pt;
	font-size:8.0pt;
	font-family:"Tahoma","sans-serif";}
p.MsoListParagraph, li.MsoListParagraph, div.MsoListParagraph
	{mso-style-priority:34;
	margin-top:0in;
	margin-right:0in;
	margin-bottom:0in;
	margin-left:.5in;
	margin-bottom:.0001pt;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
span.BalloonTextChar
	{mso-style-name:"Balloon Text Char";
	mso-style-priority:99;
	mso-style-link:"Balloon Text";
	font-family:"Tahoma","sans-serif";}
p.yiv675319147msoacetate, li.yiv675319147msoacetate, =
div.yiv675319147msoacetate
	{mso-style-name:yiv675319147msoacetate;
	mso-margin-top-alt:auto;
	margin-right:0in;
	mso-margin-bottom-alt:auto;
	margin-left:0in;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msolistparagraph, li.yiv675319147msolistparagraph, =
div.yiv675319147msolistparagraph
	{mso-style-name:yiv675319147msolistparagraph;
	mso-margin-top-alt:auto;
	margin-right:0in;
	mso-margin-bottom-alt:auto;
	margin-left:0in;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msonormal, li.yiv675319147msonormal, =
div.yiv675319147msonormal
	{mso-style-name:yiv675319147msonormal;
	mso-margin-top-alt:auto;
	margin-right:0in;
	mso-margin-bottom-alt:auto;
	margin-left:0in;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msochpdefault, li.yiv675319147msochpdefault, =
div.yiv675319147msochpdefault
	{mso-style-name:yiv675319147msochpdefault;
	mso-margin-top-alt:auto;
	margin-right:0in;
	mso-margin-bottom-alt:auto;
	margin-left:0in;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msonormal1, li.yiv675319147msonormal1, =
div.yiv675319147msonormal1
	{mso-style-name:yiv675319147msonormal1;
	mso-margin-top-alt:auto;
	margin-right:0in;
	mso-margin-bottom-alt:auto;
	margin-left:0in;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msoacetate1, li.yiv675319147msoacetate1, =
div.yiv675319147msoacetate1
	{mso-style-name:yiv675319147msoacetate1;
	mso-margin-top-alt:auto;
	margin-right:0in;
	mso-margin-bottom-alt:auto;
	margin-left:0in;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msolistparagraph1, li.yiv675319147msolistparagraph1, =
div.yiv675319147msolistparagraph1
	{mso-style-name:yiv675319147msolistparagraph1;
	mso-margin-top-alt:auto;
	margin-right:0in;
	mso-margin-bottom-alt:auto;
	margin-left:0in;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msochpdefault1, li.yiv675319147msochpdefault1, =
div.yiv675319147msochpdefault1
	{mso-style-name:yiv675319147msochpdefault1;
	mso-margin-top-alt:auto;
	margin-right:0in;
	mso-margin-bottom-alt:auto;
	margin-left:0in;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msonormal2, li.yiv675319147msonormal2, =
div.yiv675319147msonormal2
	{mso-style-name:yiv675319147msonormal2;
	margin:0in;
	margin-bottom:.0001pt;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msoacetate2, li.yiv675319147msoacetate2, =
div.yiv675319147msoacetate2
	{mso-style-name:yiv675319147msoacetate2;
	margin:0in;
	margin-bottom:.0001pt;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msolistparagraph2, li.yiv675319147msolistparagraph2, =
div.yiv675319147msolistparagraph2
	{mso-style-name:yiv675319147msolistparagraph2;
	mso-margin-top-alt:auto;
	margin-right:0in;
	mso-margin-bottom-alt:auto;
	margin-left:0in;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msonormal3, li.yiv675319147msonormal3, =
div.yiv675319147msonormal3
	{mso-style-name:yiv675319147msonormal3;
	mso-margin-top-alt:auto;
	margin-right:0in;
	mso-margin-bottom-alt:auto;
	margin-left:0in;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msochpdefault2, li.yiv675319147msochpdefault2, =
div.yiv675319147msochpdefault2
	{mso-style-name:yiv675319147msochpdefault2;
	mso-margin-top-alt:auto;
	margin-right:0in;
	mso-margin-bottom-alt:auto;
	margin-left:0in;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msonormal11, li.yiv675319147msonormal11, =
div.yiv675319147msonormal11
	{mso-style-name:yiv675319147msonormal11;
	margin:0in;
	margin-bottom:.0001pt;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msoacetate11, li.yiv675319147msoacetate11, =
div.yiv675319147msoacetate11
	{mso-style-name:yiv675319147msoacetate11;
	margin:0in;
	margin-bottom:.0001pt;
	font-size:8.0pt;
	font-family:"Arial","sans-serif";}
p.yiv675319147msolistparagraph11, li.yiv675319147msolistparagraph11, =
div.yiv675319147msolistparagraph11
	{mso-style-name:yiv675319147msolistparagraph11;
	margin-top:0in;
	margin-right:0in;
	margin-bottom:0in;
	margin-left:.5in;
	margin-bottom:.0001pt;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
p.yiv675319147msochpdefault11, li.yiv675319147msochpdefault11, =
div.yiv675319147msochpdefault11
	{mso-style-name:yiv675319147msochpdefault11;
	mso-margin-top-alt:auto;
	margin-right:0in;
	mso-margin-bottom-alt:auto;
	margin-left:0in;
	font-size:10.0pt;
	font-family:"Times New Roman","serif";}
span.yiv675319147msohyperlink
	{mso-style-name:yiv675319147msohyperlink;}
span.yiv675319147msohyperlinkfollowed
	{mso-style-name:yiv675319147msohyperlinkfollowed;}
span.yiv675319147msohyperlink1
	{mso-style-name:yiv675319147msohyperlink1;}
span.yiv675319147msohyperlinkfollowed1
	{mso-style-name:yiv675319147msohyperlinkfollowed1;}
span.yiv675319147emailstyle171
	{mso-style-name:yiv675319147emailstyle171;}
span.yiv675319147balloontextchar1
	{mso-style-name:yiv675319147balloontextchar1;}
span.yiv675319147emailstyle33
	{mso-style-name:yiv675319147emailstyle33;}
span.yiv675319147balloontextchar
	{mso-style-name:yiv675319147balloontextchar;}
span.yiv675319147msohyperlink2
	{mso-style-name:yiv675319147msohyperlink2;
	color:blue;
	text-decoration:underline;}
span.yiv675319147msohyperlinkfollowed2
	{mso-style-name:yiv675319147msohyperlinkfollowed2;
	color:purple;
	text-decoration:underline;}
span.yiv675319147msohyperlink11
	{mso-style-name:yiv675319147msohyperlink11;
	color:blue;
	text-decoration:underline;}
span.yiv675319147msohyperlinkfollowed11
	{mso-style-name:yiv675319147msohyperlinkfollowed11;
	color:purple;
	text-decoration:underline;}
span.yiv675319147emailstyle1711
	{mso-style-name:yiv675319147emailstyle1711;
	font-family:"Times New Roman","serif";
	color:#1F497D;}
span.yiv675319147balloontextchar11
	{mso-style-name:yiv675319147balloontextchar11;
	font-family:"Arial","sans-serif";}
span.yiv675319147emailstyle331
	{mso-style-name:yiv675319147emailstyle331;
	font-family:"Times New Roman","serif";
	color:#1F497D;}
span.yiv675319147balloontextchar2
	{mso-style-name:yiv675319147balloontextchar2;
	font-family:"Arial","sans-serif";}
span.EmailStyle53
	{mso-style-type:personal;
	font-family:"Calibri","sans-serif";
	color:#1F497D;}
span.EmailStyle54
	{mso-style-type:personal-reply;
	font-family:"Times New Roman","serif";
	color:#1F497D;}
.MsoChpDefault
	{mso-style-type:export-only;
	font-size:10.0pt;}
@page WordSection1
	{size:8.5in 11.0in;
	margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
	{page:WordSection1;}
 /* List Definitions */
 @list l0
	{mso-list-id:2070028218;
	mso-list-type:hybrid;
	mso-list-template-ids:796668820 67698703 67698713 67698715 67698703 =
67698713 67698715 67698703 67698713 67698715;}
@list l0:level1
	{mso-level-tab-stop:none;
	mso-level-number-position:left;
	text-indent:-.25in;}
@list l0:level2
	{mso-level-tab-stop:1.0in;
	mso-level-number-position:left;
	text-indent:-.25in;}
@list l0:level3
	{mso-level-tab-stop:1.5in;
	mso-level-number-position:left;
	text-indent:-.25in;}
@list l0:level4
	{mso-level-tab-stop:2.0in;
	mso-level-number-position:left;
	text-indent:-.25in;}
@list l0:level5
	{mso-level-tab-stop:2.5in;
	mso-level-number-position:left;
	text-indent:-.25in;}
@list l0:level6
	{mso-level-tab-stop:3.0in;
	mso-level-number-position:left;
	text-indent:-.25in;}
@list l0:level7
	{mso-level-tab-stop:3.5in;
	mso-level-number-position:left;
	text-indent:-.25in;}
@list l0:level8
	{mso-level-tab-stop:4.0in;
	mso-level-number-position:left;
	text-indent:-.25in;}
@list l0:level9
	{mso-level-tab-stop:4.5in;
	mso-level-number-position:left;
	text-indent:-.25in;}
ol
	{margin-bottom:0in;}
ul
	{margin-bottom:0in;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext=3D"edit" spidmax=3D"1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext=3D"edit">
  <o:idmap v:ext=3D"edit" data=3D"1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=3DEN-US link=3Dblue vlink=3Dpurple>

<div class=3DWordSection1>

<p class=3DMsoNormal><span style=3D'font-size:11.0pt;color:#1F497D'>Hi =
Ladda,<o:p></o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=3DMsoNormal><span style=3D'font-size:11.0pt;color:#1F497D'>Your =
case is
pretty simple, when you make table alias (a11, a12), you should use it =
in the
hint MAPJOIN<o:p></o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;color:#1F497D'>That=E2=80=99s mean
your sql should be look like:<o:p></o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=3DMsoNormal><i><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>select /*+ MAPJOIN(</span></i><b><i><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:red'>a11</span></i></b><i><span
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497=
D'>) */
a12.shipper_id, count(1), count (distinct a11.customer_id), =
sum(a11.qty_sold)
from orderfactpartclust2 a12 join orderdetailpartclust2 a11 on =
(a11.order_id =3D
a12.order_id) where (a11.order_date =3D '09-30-2008' and a12.order_date =
=3D
'2008-09-30') group by a12.shipper_id;<o:p></o:p></span></i></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<div>

<p class=3DMsoNormal><i><span =
style=3D'font-size:10.0pt;color:#1F497D'>Best =
regards<o:p></o:p></span></i></p>

<p class=3DMsoNormal><span style=3D'font-size:10.0pt;font-family:"Arial =
Narrow","sans-serif";
color:#E36C0A'>Nguyen Thanh Binh (Mr)</span><span =
style=3D'font-size:10.0pt;
font-family:"Arial =
Narrow","sans-serif";color:#E36C0A'><o:p></o:p></span></p>

</div>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<div>

<div style=3D'border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt =
0in 0in 0in'>

<p class=3DMsoNormal><b><span =
style=3D'font-size:10.0pt;font-family:"Tahoma","sans-serif"'>From:</span>=
</b><span
style=3D'font-size:10.0pt;font-family:"Tahoma","sans-serif"'> Ladda, =
Anand
[mailto:lanand@microstrategy.com] <br>
<b>Sent:</b> Wednesday, April 11, 2012 3:23 AM<br>
<b>To:</b> user@hive.apache.org<br>
<b>Subject:</b> RE: [Marketing Mail] Re: Why BucketJoinMap consume too =
much
memory<o:p></o:p></span></p>

</div>

</div>

<p class=3DMsoNormal><o:p>&nbsp;</o:p></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Hi Bejoy/Binh<o:p></o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Been following this thread to better understand where =
bucket map
join would help and it=E2=80=99s been a great thread to follow. I have =
struggling with
this on my end as well. <o:p></o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>I have two tables one of which is about 22GB
(orderdetailpartclust2) in size and the other is 1.5GB =
(orderfactpartclust2) in
size (all partitions combined) and I wanted to see the impact of =
different kind
of joins on one of the partitions of these table . =
<o:p></o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>I created a partitioned (order_date) and bucketed (on =
order_id,
on which I want to join these tables) version for these tables for this
analysis. Data was loaded from their non-partitioned counterparts and =
setting
the following parameters to ensure that data makes it into the right =
partitions
and is bucketed correctly by Hive<o:p></o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>set =
hive.exec.dynamic.partition.mode=3Dnonstrict;<o:p></o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>set =
hive.exec.dynamic.partition=3Dtrue;<o:p></o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>SET =
hive.exec.max.dynamic.partitions=3D100000;<o:p></o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>SET =
hive.exec.max.dynamic.partitions.pernode=3D100000;<o:p></o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>set hive.enforce.bucketing =3D =
true;<o:p></o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>However when I try to do the following join query, I =
don=E2=80=99t get
any bucketed map side join<o:p></o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=3DMsoNormal><i><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>select /*+ MAPJOIN(orderfactpartclust2) */ =
a12.shipper_id,
count(1), count (distinct a11.customer_id), sum(a11.qty_sold) from
orderfactpartclust2 a12 join orderdetailpartclust2 a11 on (a11.order_id =
=3D
a12.order_id) where (a11.order_date =3D '09-30-2008' and a12.order_date =
=3D
'2008-09-30') group by a12.shipper_id;<o:p></o:p></span></i></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Below are the relevant pieces of information on each of =
these
tables. Can you please help take a look to see what I might be missing =
to get
map side joins. Is it because my tables are also partitioned that this =
isn=E2=80=99t
working?<o:p></o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=3DMsoNormal><span =
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=3DMsoListParagraph style=3D'text-indent:-.25in;mso-list:l0 =
level1 lfo2'><![if !supportLists]><b><span
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497=
D'><span
style=3D'mso-list:Ignore'>1.<span style=3D'font:7.0pt "Times New =
Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span></span></span></b><![endif]><b><span =
style=3D'font-size:11.0pt;font-family:
"Calibri","sans-serif";color:#1F497D'>hive&gt; describe formatted
orderdetailpartclust2;<o:p></o:p></span></b></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>OK<o:p></o:p></span></p=
>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>#
col_name&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
data_type&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;
comment<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>order_id&nbsp;&nbsp;&nb=
sp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;
int&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>item_id&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;
int&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>emp_id&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;
int&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>promotion_id&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
int&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;from
deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>customer_id&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
int&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>qty_sold&nbsp;&nbsp;&nb=
sp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;
float&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>unit_price&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
float&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>unit_cost&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;float&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>discount&nbsp;&nbsp;&nb=
sp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;
float&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'># Partition =
Information<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>#
col_name&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
data_type&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;
comment<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>order_date&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
string&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
None<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'># Detailed Table =
Information<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Database:&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
default<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Owner:&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;
hdfs<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>CreateTime:&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
Thu Apr 05 17:01:22 EDT 2012<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>LastAccessTime:&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
UNKNOWN<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Protect
Mode:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
None<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Retention:&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Location:&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
hdfs://hadoop001:6931/user/hive/warehouse/orderdetailpartclust2<o:p></o:p=
></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Table
Type:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;
MANAGED_TABLE<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Table =
Parameters:<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
SORTBUCKETCOLSPREFIX&nbsp;&nbsp;&nbsp; TRUE<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
numFiles&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;
19200<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
numPartitions&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
 75<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;numRows&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
totalSize&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;
22814162038<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
transient_lastDdlTime&nbsp;&nbsp; 1333725153<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'># Storage =
Information<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>SerDe
Library:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe<o:p></o:p></span></p=
>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>InputFormat:&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
org.apache.hadoop.hive.ql.io.RCFileInputFormat<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>OutputFormat:&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
org.apache.hadoop.hive.ql.io.RCFileOutputFormat<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Compressed:&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
No<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Num
Buckets:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
; 256<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Bucket
Columns:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
[order_id]<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Sort
Columns:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
[Order(col:order_id, order:1)]<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Storage Desc =
Params:<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
escape.delim&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;
\\<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
field.delim&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;
\t<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
serialization.format&nbsp;&nbsp;&nbsp; \t<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Time taken: 3.255 =
seconds<o:p></o:p></span></p>

<p class=3DMsoListParagraph style=3D'text-indent:-.25in;mso-list:l0 =
level1 lfo2'><![if !supportLists]><b><span
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497=
D'><span
style=3D'mso-list:Ignore'>2.<span style=3D'font:7.0pt "Times New =
Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span></span></span></b><![endif]><b><span =
style=3D'font-size:11.0pt;font-family:
"Calibri","sans-serif";color:#1F497D'>hive&gt; describe formatted
orderfactpartclust2;<o:p></o:p></span></b></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>OK<o:p></o:p></span></p=
>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>#
col_name&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
data_type&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;
comment<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>order_id&nbsp;&nbsp;&nb=
sp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;
int&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>emp_id&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;
int&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>order_amt&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
float&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>order_cost&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
float&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>qty_sold&nbsp;&nbsp;&nb=
sp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;
float&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>freight&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;
float&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>gross_dollar_sales&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;
float&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>ship_date&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
string&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>rush_order&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
string&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>customer_id&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
int&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>pymt_type&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
int&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>shipper_id&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
int&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
from deserializer<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'># Partition =
Information<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>#
col_name&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
data_type&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;
comment<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>order_date&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
string&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
None<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'># Detailed Table =
Information<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Database:&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
default<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Owner:&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;
hdfs<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>CreateTime:&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
Thu Apr 05 18:09:28 EDT 2012<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>LastAccessTime:&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
UNKNOWN<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Protect
Mode:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
None<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Retention:&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Location:&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
hdfs://hadoop001:6931/user/hive/warehouse/orderfactpartclust2<o:p></o:p><=
/span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Table
Type:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;
MANAGED_TABLE<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Table =
Parameters:<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
SORTBUCKETCOLSPREFIX&nbsp;&nbsp;&nbsp; TRUE<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
numFiles&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;
7680<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
numPartitions&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
 30<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
numRows&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
totalSize&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;
1528946078<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
transient_lastDdlTime&nbsp;&nbsp; 1333722539<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'># Storage =
Information<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>SerDe
Library:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe<o:p></o:p></span></p=
>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>InputFormat:&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
org.apache.hadoop.hive.ql.io.RCFileInputFormat<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>OutputFormat:&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
org.apache.hadoop.hive.ql.io.RCFileOutputFormat<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Compressed:&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
No<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Num
Buckets:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
; 256<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Bucket
Columns:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
[order_id]<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Sort
Columns:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
[Order(col:order_id, order:1)]<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Storage Desc =
Params:<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
escape.delim&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;
\\<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
field.delim&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;
\t<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;
serialization.format&nbsp;&nbsp;&nbsp; \t<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Time taken: 1.737 =
seconds<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoListParagraph style=3D'text-indent:-.25in;mso-list:l0 =
level1 lfo2'><![if !supportLists]><b><span
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497=
D'><span
style=3D'mso-list:Ignore'>3.<span style=3D'font:7.0pt "Times New =
Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span></span></span></b><![endif]><b><span =
style=3D'font-size:11.0pt;font-family:
"Calibri","sans-serif";color:#1F497D'>-bash-4.1$ hadoop fs -du
/user/hive/warehouse/orderdetailpartclust2;<o:p></o:p></span></b></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>299867901&nbsp;&nbsp;
hdfs://hadoop001:6931/user/hive/warehouse/orderdetailpartclust2/order_dat=
e=3D01-01-2008<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>.<o:p></o:p></span></p>=


<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>.<o:p></o:p></span></p>=


<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>.<o:p></o:p></span></p>=


<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>311033139&nbsp;&nbsp; =
hdfs://hadoop001:6931/user/hive/warehouse/orderdetailpartclust2/order_dat=
e=3D09-30-2008<o:p></o:p></span></p>

<p class=3DMsoListParagraph style=3D'text-indent:-.25in;mso-list:l0 =
level1 lfo2'><![if !supportLists]><b><span
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497=
D'><span
style=3D'mso-list:Ignore'>4.<span style=3D'font:7.0pt "Times New =
Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span></span></span></b><![endif]><b><span =
style=3D'font-size:11.0pt;font-family:
"Calibri","sans-serif";color:#1F497D'>-bash-4.1$ hadoop fs -du
/user/hive/warehouse/orderdetailpartclust2/order_date=3D09-30-2008;<o:p><=
/o:p></span></b></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Found 256 =
items<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>1213444&nbsp;&nbsp;&nbs=
p;&nbsp;
hdfs://hadoop001:6931/user/hive/warehouse/orderdetailpartclust2/order_dat=
e=3D09-30-2008/000000_0<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>.<o:p></o:p></span></p>=


<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>.<o:p></o:p></span></p>=


<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>.<o:p></o:p></span></p>=


<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>1213166&nbsp;&nbsp;&nbs=
p;&nbsp;
hdfs://hadoop001:6931/user/hive/warehouse/orderdetailpartclust2/order_dat=
e=3D09-30-2008/000255_0<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>-bash-4.1$<o:p></o:p></=
span></p>

<p class=3DMsoListParagraph style=3D'text-indent:-.25in;mso-list:l0 =
level1 lfo2'><![if !supportLists]><span
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497=
D'><span
style=3D'mso-list:Ignore'>5.<span style=3D'font:7.0pt "Times New =
Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span></span></span><![endif]><b><span =
style=3D'font-size:11.0pt;font-family:
"Calibri","sans-serif";color:#1F497D'>-bash-4.1$ hadoop fs -du
/user/hive/warehouse/orderfactpartclust2;</span></b><span =
style=3D'font-size:
11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p></o:p></spa=
n></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Found 30 =
items<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>50943109&nbsp;&nbsp;&nb=
sp;
hdfs://hadoop001:6931/user/hive/warehouse/orderfactpartclust2/order_date=3D=
2008-09-01<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>.<o:p></o:p></span></p>=


<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>.<o:p></o:p></span></p>=


<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>.<o:p></o:p></span></p>=


<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>50902368&nbsp;&nbsp;&nb=
sp;
hdfs://hadoop001:6931/user/hive/warehouse/orderfactpartclust2/order_date=3D=
2008-09-30<o:p></o:p></span></p>

<p class=3DMsoListParagraph style=3D'text-indent:-.25in;mso-list:l0 =
level1 lfo2'><![if !supportLists]><b><span
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497=
D'><span
style=3D'mso-list:Ignore'>6.<span style=3D'font:7.0pt "Times New =
Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span></span></span></b><![endif]><b><span =
style=3D'font-size:11.0pt;font-family:
"Calibri","sans-serif";color:#1F497D'>bash-4.1$ hadoop fs -du
/user/hive/warehouse/orderfactpartclust2/order_date=3D2008-09-30;<o:p></o=
:p></span></b></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Found 256 =
items<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>198692&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
hdfs://hadoop001:6931/user/hive/warehouse/orderfactpartclust2/order_date=3D=
2008-09-30/000000_0<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>.<o:p></o:p></span></p>=


<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>.<o:p></o:p></span></p>=


<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>.<o:p></o:p></span></p>=


<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>198954&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
hdfs://hadoop001:6931/user/hive/warehouse/orderfactpartclust2/order_date=3D=
2008-09-30/000255_0<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoListParagraph style=3D'text-indent:-.25in;mso-list:l0 =
level1 lfo2'><![if !supportLists]><b><span
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497=
D'><span
style=3D'mso-list:Ignore'>7.<span style=3D'font:7.0pt "Times New =
Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span></span></span></b><![endif]><b><span =
style=3D'font-size:11.0pt;font-family:
"Calibri","sans-serif";color:#1F497D'>-bash-4.1$ cat =
hive-site.xml<o:p></o:p></span></b></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;?xml
version=3D&quot;1.0&quot;?&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;?xml-stylesheet
type=3D&quot;text/xsl&quot; =
href=3D&quot;configuration.xsl&quot;?&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;configuration&gt;<o=
:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;!-- Hive =
Configuration
can either be stored in this file or in the hadoop configuration =
files&nbsp;
--&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;!-- that are =
implied by Hadoop
setup
variables.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nb=
sp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=

--&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;!-- Aside from =
Hadoop
setup variables - this file is provided as a convenience so that
Hive&nbsp;&nbsp;&nbsp; --&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;!-- users do not =
have to
edit hadoop configuration files (that may be managed as a centralized =
--&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;!--
resource).&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nb=
sp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
--&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;!-- Hive Execution
Parameters --&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;property&gt;<o:p></=
o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;
&lt;name&gt;javax.jdo.option.ConnectionURL&lt;/name&gt;<o:p></o:p></span>=
</p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp; &lt;!--
jdbc:derby:/hadoophome/metastore_db;create=3Dtrue =
--&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;
&lt;value&gt;jdbc:derby://hadoop010:1527/;databaseName=3Dmetastore_db;cre=
ate=3Dtrue&lt;/value&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;
&lt;description&gt;JDBC connect string for a JDBC =
metastore&lt;/description&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;/property&gt;<o:p><=
/o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;property&gt;<o:p></=
o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;
&lt;name&gt;javax.jdo.option.ConnectionDriverName&lt;/name&gt;<o:p></o:p>=
</span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp; =
&lt;value&gt;org.apache.derby.jdbc.EmbeddedDriver&lt;/value&gt;<o:p></o:p=
></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;
&lt;description&gt;Driver class name for a JDBC =
metastore&lt;/description&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;/property&gt;<o:p><=
/o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;property&gt;<o:p></=
o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;
&lt;name&gt;hive.hwi.war.file&lt;/name&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp;
&lt;value&gt;/usr/lib/hive/lib/hive-hwi-0.7.0-cdh3u0.war&lt;/value&gt;<o:=
p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp; =
&lt;description&gt;This
is the WAR file with the jsp content for Hive Web =
Interface&lt;/description&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;/property&gt;<o:p><=
/o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&lt;/configuration&gt;<=
o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:1.0in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoListParagraph style=3D'text-indent:-.25in;mso-list:l0 =
level1 lfo2'><![if !supportLists]><b><span
style=3D'font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497=
D'><span
style=3D'mso-list:Ignore'>8.<span style=3D'font:7.0pt "Times New =
Roman"'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span></span></span></b><![endif]><b><span =
style=3D'font-size:11.0pt;font-family:
"Calibri","sans-serif";color:#1F497D'>Performing =
Join<o:p></o:p></span></b></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span=
></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>hive&gt; set
hive.optimize.bucketmapjoin=3Dtrue;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>hive&gt; set
hive.enforce.bucketing=3Dtrue;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>hive&gt; set
hive.input.format=3Dorg.apache.hadoop.hive.ql.io.BucketizedHiveInputForma=
t;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>hive&gt; select /*+
MAPJOIN(orderfactpartclust2) */ a12.shipper_id, count(1), count =
(distinct
a11.customer_id), sum(a11.qty_sold) from orderfactpartclust2 a12 join
orderdetailpartclust2 a11 on (a11.order_id =3D a12.order_id) where
(a11.order_date =3D '09-30-2008' and a12.order_date =3D '2008-09-30') =
group by
a12.shipper_id;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Total MapReduce jobs =
=3D 2<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Launching Job 1 out of =
2<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Number of reduce tasks =
not
specified. Estimated from input data size: 1<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>In order to change the
average load for a reducer (in bytes):<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp; set
hive.exec.reducers.bytes.per.reducer=3D&lt;number&gt;<o:p></o:p></span></=
p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>In order to limit the =
maximum
number of reducers:<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp; set
hive.exec.reducers.max=3D&lt;number&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>In order to set a =
constant
number of reducers:<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp; set
mapred.reduce.tasks=3D&lt;number&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Starting Job =3D
job_201202131643_1294, Tracking URL =3D <a
href=3D"http://hadoop001:50030/jobdetails.jsp?jobid=3Djob_201202131643_12=
94">http://hadoop001:50030/jobdetails.jsp?jobid=3Djob_201202131643_1294</=
a><o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Kill Command =3D
/usr/lib/hadoop/bin/hadoop job&nbsp; =
-Dmapred.job.tracker=3Dhadoop001:6932 -kill
job_201202131643_1294<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:06,663
Stage-1 map =3D 0%,&nbsp; reduce =3D 0%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:08,671
Stage-1 map =3D 1%,&nbsp; reduce =3D 0%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:09,675
Stage-1 map =3D 3%,&nbsp; reduce =3D 0%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:10,679
Stage-1 map =3D 4%,&nbsp; reduce =3D 0%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:11,683
Stage-1 map =3D 5%,&nbsp; reduce =3D 0%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:12,688
Stage-1 map =3D 7%,&nbsp; reduce =3D 0%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:13,692
Stage-1 map =3D 8%,&nbsp; reduce =3D 0%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:14,697
Stage-1 map =3D 10%,&nbsp; reduce =3D 0%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:15,756
Stage-1 map =3D 12%,&nbsp; reduce =3D 0%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:16,761
Stage-1 map =3D 13%,&nbsp; reduce =3D 0%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:17,767
Stage-1 map =3D 14%,&nbsp; reduce =3D 0%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:18,773
Stage-1 map =3D 16%,&nbsp; reduce =3D 0%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:19,778
Stage-1 map =3D 17%,&nbsp; reduce =3D 1%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:20,784
Stage-1 map =3D 18%,&nbsp; reduce =3D 1%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:21,789
Stage-1 map =3D 20%,&nbsp; reduce =3D 1%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:22,795
Stage-1 map =3D 21%,&nbsp; reduce =3D 5%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:23,800
Stage-1 map =3D 23%,&nbsp; reduce =3D 5%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:24,805
Stage-1 map =3D 24%,&nbsp; reduce =3D 5%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:25,936
Stage-1 map =3D 25%,&nbsp; reduce =3D 8%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:26,941
Stage-1 map =3D 27%,&nbsp; reduce =3D 8%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:27,947
Stage-1 map =3D 28%,&nbsp; reduce =3D 8%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:28,951
Stage-1 map =3D 30%,&nbsp; reduce =3D 8%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:29,956
Stage-1 map =3D 31%,&nbsp; reduce =3D 8%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:30,981
Stage-1 map =3D 32%,&nbsp; reduce =3D 8%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:31,987
Stage-1 map =3D 34%,&nbsp; reduce =3D 8%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:32,992
Stage-1 map =3D 35%,&nbsp; reduce =3D 10%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:33,998
Stage-1 map =3D 37%,&nbsp; reduce =3D 10%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:35,003
Stage-1 map =3D 38%,&nbsp; reduce =3D 10%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:36,055
Stage-1 map =3D 40%,&nbsp; reduce =3D 10%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:37,097
Stage-1 map =3D 42%,&nbsp; reduce =3D 10%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:38,102
Stage-1 map =3D 43%,&nbsp; reduce =3D 10%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:39,108
Stage-1 map =3D 44%,&nbsp; reduce =3D 10%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:40,113
Stage-1 map =3D 46%,&nbsp; reduce =3D 10%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:41,123
Stage-1 map =3D 47%,&nbsp; reduce =3D 10%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:42,128
Stage-1 map =3D 49%,&nbsp; reduce =3D 15%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:43,134
Stage-1 map =3D 50%,&nbsp; reduce =3D 15%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:44,139 Stage-1
map =3D 53%,&nbsp; reduce =3D 15%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:46,152
Stage-1 map =3D 54%,&nbsp; reduce =3D 15%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:47,158
Stage-1 map =3D 57%,&nbsp; reduce =3D 15%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:48,164
Stage-1 map =3D 58%,&nbsp; reduce =3D 15%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:49,171
Stage-1 map =3D 60%,&nbsp; reduce =3D 15%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:50,176
Stage-1 map =3D 61%,&nbsp; reduce =3D 15%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:51,182
Stage-1 map =3D 63%,&nbsp; reduce =3D 19%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:52,199
Stage-1 map =3D 65%,&nbsp; reduce =3D 19%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:53,222
Stage-1 map =3D 66%,&nbsp; reduce =3D 19%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:54,228 Stage-1
map =3D 68%,&nbsp; reduce =3D 19%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:55,234
Stage-1 map =3D 70%,&nbsp; reduce =3D 19%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:56,241
Stage-1 map =3D 71%,&nbsp; reduce =3D 19%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:57,248
Stage-1 map =3D 73%,&nbsp; reduce =3D 21%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:58,253
Stage-1 map =3D 75%,&nbsp; reduce =3D 21%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:15:59,260
Stage-1 map =3D 76%,&nbsp; reduce =3D 21%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:00,267
Stage-1 map =3D 79%,&nbsp; reduce =3D 21%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:01,273
Stage-1 map =3D 80%,&nbsp; reduce =3D 21%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:02,280
Stage-1 map =3D 81%,&nbsp; reduce =3D 21%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:03,287 Stage-1
map =3D 83%,&nbsp; reduce =3D 27%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:04,294
Stage-1 map =3D 84%,&nbsp; reduce =3D 27%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:05,302
Stage-1 map =3D 86%,&nbsp; reduce =3D 27%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:06,310
Stage-1 map =3D 87%,&nbsp; reduce =3D 27%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:07,317
Stage-1 map =3D 90%,&nbsp; reduce =3D 27%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:08,325
Stage-1 map =3D 91%,&nbsp; reduce =3D 27%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:09,332
Stage-1 map =3D 92%,&nbsp; reduce =3D 27%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:10,339
Stage-1 map =3D 94%,&nbsp; reduce =3D 27%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:11,348
Stage-1 map =3D 95%,&nbsp; reduce =3D 27%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:12,355
Stage-1 map =3D 97%,&nbsp; reduce =3D 29%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:13,362
Stage-1 map =3D 99%,&nbsp; reduce =3D 29%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:14,370
Stage-1 map =3D 100%,&nbsp; reduce =3D 29%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:18,396
Stage-1 map =3D 100%,&nbsp; reduce =3D 32%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:24,654 Stage-1
map =3D 100%,&nbsp; reduce =3D 67%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:27,683
Stage-1 map =3D 100%,&nbsp; reduce =3D 70%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:30,701
Stage-1 map =3D 100%,&nbsp; reduce =3D 73%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:33,719
Stage-1 map =3D 100%,&nbsp; reduce =3D 77%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:36,739
Stage-1 map =3D 100%,&nbsp; reduce =3D 80%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:39,781
Stage-1 map =3D 100%,&nbsp; reduce =3D 84%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:42,806
Stage-1 map =3D 100%,&nbsp; reduce =3D 88%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:45,824
Stage-1 map =3D 100%,&nbsp; reduce =3D 92%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:48,840
Stage-1 map =3D 100%,&nbsp; reduce =3D 97%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:50,854
Stage-1 map =3D 100%,&nbsp; reduce =3D 100%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Ended Job =3D
job_201202131643_1294<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Launching Job 2 out of =
2<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Number of reduce tasks =
not
specified. Estimated from input data size: 1<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>In order to change the
average load for a reducer (in bytes):<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp; set =
hive.exec.reducers.bytes.per.reducer=3D&lt;number&gt;<o:p></o:p></span></=
p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>In order to limit the =
maximum
number of reducers:<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp; set
hive.exec.reducers.max=3D&lt;number&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>In order to set a =
constant
number of reducers:<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>&nbsp; set
mapred.reduce.tasks=3D&lt;number&gt;<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Starting Job =3D
job_201202131643_1295, Tracking URL =3D <a
href=3D"http://hadoop001:50030/jobdetails.jsp?jobid=3Djob_201202131643_12=
95">http://hadoop001:50030/jobdetails.jsp?jobid=3Djob_201202131643_1295</=
a><o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Kill Command =3D
/usr/lib/hadoop/bin/hadoop job&nbsp; =
-Dmapred.job.tracker=3Dhadoop001:6932 -kill
job_201202131643_1295<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:16:56,693
Stage-2 map =3D 0%,&nbsp; reduce =3D 0%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:17:02,716
Stage-2 map =3D 100%,&nbsp; reduce =3D 0%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2012-04-10 =
16:17:12,759
Stage-2 map =3D 100%,&nbsp; reduce =3D 100%<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Ended Job =3D
job_201202131643_1295<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>OK<o:p></o:p></span></p=
>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>1&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;
678832&nbsp; 67850&nbsp;&nbsp; 678832.0<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>2&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;
1360529 135253&nbsp; 1360529.0<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>3&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;
4784635 460994&nbsp; 4784635.0<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>Time taken: 131.748 =
seconds<o:p></o:p></span></p>

<p class=3DMsoNormal style=3D'margin-left:.25in'><span =
style=3D'font-size:11.0pt;
font-family:"Calibri","sans-serif";color:#1F497D'>hive&gt;<o:p></o:p></sp=
an></p>

<div>

<div style=3D'border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt =
0in 0in 0in'>

<p class=3DMsoNormal><b><span =
style=3D'font-size:10.0pt;font-family:"Tahoma","sans-serif"'>From:</span>=
</b><span
style=3D'font-size:10.0pt;font-family:"Tahoma","sans-serif"'> Bejoy Ks =
[<a
href=3D"mailto:bejoy_ks@yahoo.com">mailto:bejoy_ks@yahoo.com</a>] <br>
<b>Sent:</b> Tuesday, April 10, 2012 11:44 AM<br>
<b>To:</b> <a =
href=3D"mailto:user@hive.apache.org">user@hive.apache.org</a><br>
<b>Subject:</b> [Marketing Mail] Re: Why BucketJoinMap consume too much =
memory<o:p></o:p></span></p>

</div>

</div>

<p class=3DMsoNormal><o:p>&nbsp;</o:p></p>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Verdana","sans-serif";color:black'>Hi =
Binh<o:p></o:p></span></p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Verdana","sans-serif";color:black'>&nbsp; &nbsp; &nbsp; You =
are
right, here both of your tables are of the same size. And loading 2GB od =
data
into hash tables and then to temp files and so on would take some time. =
This
time becomes negligible if it was like, one table was of 2GB and other =
of 2TB,
then you'll notice the wide difference in performance between a common =
join and
bucketed map join.<o:p></o:p></span></p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Verdana","sans-serif";color:black'>&nbsp; &nbsp; &nbsp; If =
one of
the table is too small map join would be good, if it is of moderate size =
then
bucketed map join.&nbsp;<o:p></o:p></span></p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Verdana","sans-serif";color:black'><o:p>&nbsp;</o:p></span><=
/p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Verdana","sans-serif";color:black'>Regards<o:p></o:p></span>=
</p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Verdana","sans-serif";color:black'>Bejoy =
KS<o:p></o:p></span></p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Verdana","sans-serif";color:black'><o:p>&nbsp;</o:p></span><=
/p>

</div>

<div>

<div>

<div>

<div class=3DMsoNormal align=3Dcenter =
style=3D'text-align:center;background:white'><span
style=3D'font-size:10.0pt;font-family:"Arial","sans-serif";color:black'>

<hr size=3D1 width=3D"100%" align=3Dcenter>

</span></div>

<p class=3DMsoNormal style=3D'background:white'><b><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>From:</span></b><span
style=3D'font-size:10.0pt;font-family:"Arial","sans-serif";color:black'> =
binhnt22
&lt;<a =
href=3D"mailto:Binhnt22@viettel.com.vn">Binhnt22@viettel.com.vn</a>&gt;<b=
r>
<b>To:</b> <a =
href=3D"mailto:user@hive.apache.org">user@hive.apache.org</a> <br>
<b>Cc:</b> 'Bejoy Ks' &lt;<a =
href=3D"mailto:bejoy_ks@yahoo.com">bejoy_ks@yahoo.com</a>&gt;
<br>
<b>Sent:</b> Tuesday, April 10, 2012 8:10 AM<br>
<b>Subject:</b> RE: Why BucketJoinMap consume too much =
memory</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

<p class=3DMsoNormal =
style=3D'margin-bottom:12.0pt;background:white'><span
style=3D'color:black'><o:p>&nbsp;</o:p></span></p>

<div id=3Dyiv675319147>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>Hi Bejoy,</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>It worked like a charm. Thank you very much. I really =
really
appreciate your help.</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>This bucket join should be used with 1 big table and 1 =
small
table. </span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>If both table are big, the join time would be much more =
than
normal join.</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><i><span =
style=3D'font-size:10.0pt;
color:#1F497D'>Best regards</span></i><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:#E36C0A'>Nguyen Thanh Binh =
(Mr)</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:#548DD4'>Cell phone: =
(+84)</span><span
style=3D'font-size:10.0pt;font-family:"Arial","sans-serif";color:red'>98.=
226.0622</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

<div>

<div style=3D'border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt =
0in 0in 0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><b><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>From:</span></b><span
style=3D'font-size:10.0pt;font-family:"Arial","sans-serif";color:black'> =
Bejoy Ks
[<a href=3D"mailto:bejoy_ks@yahoo.com">mailto:bejoy_ks@yahoo.com</a>] =
<br>
<b>Sent:</b> Monday, April 09, 2012 9:49 PM<br>
<b>To:</b> <a =
href=3D"mailto:user@hive.apache.org">user@hive.apache.org</a><br>
<b>Subject:</b> Re: Why BucketJoinMap consume too much =
memory</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>Hi Binh</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;&nbsp;&nbsp;&nbsp; =
It is
just an issue with the number of buckets. Your tables has just 8 =
buckets, as
there only 8 files are seen the storage directory. You might have just =
issued
an ALTER TABLE script on an existing bucketed table. The work around =
here is</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>1) You need to wipe and =
reload
the tables with hive.enforce.bucketing=3Dtrue;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nb=
sp;&nbsp;
Ensure your storage directory as that many files as the number of =
buckets. As
per your table DDL you should see 256 files.</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>2) Enable
hive.optimize.bucketmapjoin =3D true; and try doing the join =
again.</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>It should definitely =
work.</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>Regards</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>Bejoy KS</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<div>

<div class=3DMsoNormal align=3Dcenter =
style=3D'text-align:center;background:white'><span
style=3D'font-size:10.0pt;font-family:"Arial","sans-serif";color:black'>

<hr size=3D1 width=3D"100%" align=3Dcenter>

</span></div>

<div>

<p class=3DMsoNormal style=3D'background:white'><b><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>From:</span></b><span
style=3D'font-size:10.0pt;font-family:"Arial","sans-serif";color:black'> =
binhnt22
&lt;<a href=3D"mailto:Binhnt22@viettel.com.vn" =
target=3D"_blank">Binhnt22@viettel.com.vn</a>&gt;<br>
<b>To:</b> <a href=3D"mailto:user@hive.apache.org" =
target=3D"_blank">user@hive.apache.org</a>
<br>
<b>Cc:</b> 'Bejoy Ks' &lt;<a href=3D"mailto:bejoy_ks@yahoo.com" =
target=3D"_blank">bejoy_ks@yahoo.com</a>&gt;
<br>
<b>Sent:</b> Monday, April 9, 2012 8:42 AM<br>
<b>Subject:</b> RE: Why BucketJoinMap consume too much =
memory</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<p class=3DMsoNormal =
style=3D'margin-bottom:12.0pt;background:white'><span
style=3D'color:black'><o:p>&nbsp;</o:p></span></p>

</div>

<div id=3Dyiv675319147>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>Hi Bejoy,</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'><br>
Thank you for helping me. Here is the information </span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>1.</span><span =
style=3D'font-size:7.0pt;color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span><u><span style=3D'font-size:11.0pt;color:#1F497D'>Describe =
Formatted
ra_md_syn;</span></u><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>#
col_name&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
data_type&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;
comment</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>calling&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
string&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
None</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>total_duration&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;
bigint&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
None</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>total_volume&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;
bigint&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
None</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>total_charge&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;
bigint&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
None</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'># Detailed Table Information</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Database:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nb=
sp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
default</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Owner:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
hduser</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>CreateTime:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;
Thu Apr 05 09:48:29 ICT 2012</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>LastAccessTime:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nb=
sp;
UNKNOWN</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Protect
Mode:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
None</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Retention:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;
0</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Location:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nb=
sp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
hdfs://master:54310/user/hive/warehouse/ra_md_syn</span><span =
style=3D'color:
black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Table
Type:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;
MANAGED_TABLE</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Table Parameters:</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
numFiles&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;
8</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
numPartitions&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
 0</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
numRows&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rawDataSize&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;
0</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
totalSize&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;
1872165483</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
transient_lastDdlTime&nbsp;&nbsp; 1333595095</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'># Storage Information</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>SerDe
Library:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>InputFormat:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;
org.apache.hadoop.mapred.TextInputFormat</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>OutputFormat:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputForm&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;
at</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Compressed:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;
No</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Num
Buckets:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
; 256</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Bucket =
Columns:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
[calling]</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Sort
Columns:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
[]</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Storage Desc Params:</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
serialization.format&nbsp;&nbsp;&nbsp; 1</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2.</span><span =
style=3D'font-size:7.0pt;color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span><u><span style=3D'font-size:11.0pt;color:#1F497D'>Describe
Formatted&nbsp;ra_ocs_syn;</span></u><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>#
col_name&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
data_type&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;
comment</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>calling&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
string&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
None</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>total_duration&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;
bigint&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
None</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>total_volume&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;
bigint&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
None</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>total_charge&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;
bigint&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
None</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'># Detailed Table Information</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Database:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nb=
sp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
default</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Owner:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
hduser</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>CreateTime:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;
Thu Apr 05 09:48:24 ICT 2012</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>LastAccessTime:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nb=
sp;
UNKNOWN</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Protect
Mode:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
None</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Retention:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;&nbsp;&nbsp;&nbsp;
0</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Location:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nb=
sp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
hdfs://master:54310/user/hive/warehouse/ra_ocs_syn</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Table
Type:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;
MANAGED_TABLE</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Table Parameters:</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
numFiles&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;8</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
numPartitions&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
 0</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
numRows&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
0</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rawDataSize&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;&nbsp;
0</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
totalSize&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;
1872162225</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
transient_lastDdlTime&nbsp;&nbsp; 1333595512</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'># Storage Information</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>SerDe =
Library:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>InputFormat:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;
org.apache.hadoop.mapred.TextInputFormat</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>OutputFormat:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Compressed:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;
No</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Num
Buckets:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
; 256</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Bucket =
Columns:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
[calling]</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Sort
Columns:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
[]</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Storage Desc Params:</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
serialization.format&nbsp;&nbsp;&nbsp; 1</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>3.</span><span =
style=3D'font-size:7.0pt;color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span><u><span style=3D'font-size:11.0pt;color:#1F497D'>hadoop fs -du =
&lt;hdfs
location of&nbsp;ra_md_syn&nbsp;&gt;</span></u><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>[hduser@master hadoop-0.20.203.0]$ bin/hadoop fs -du
/user/hive/warehouse/ra_md_syn</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Found 8 items</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>280371407&nbsp;&nbsp;
hdfs://master:54310/user/hive/warehouse/ra_md_syn/000000_1</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>280371407&nbsp;&nbsp;
hdfs://master:54310/user/hive/warehouse/ra_md_syn/000001_0</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>274374970&nbsp;&nbsp;
hdfs://master:54310/user/hive/warehouse/ra_md_syn/000002_1</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>274374970&nbsp;&nbsp; =
hdfs://master:54310/user/hive/warehouse/ra_md_syn/000003_1</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>269949415&nbsp;&nbsp;
hdfs://master:54310/user/hive/warehouse/ra_md_syn/000004_0</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>262439067&nbsp;&nbsp;
hdfs://master:54310/user/hive/warehouse/ra_md_syn/000005_0</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>205767721&nbsp;&nbsp;
hdfs://master:54310/user/hive/warehouse/ra_md_syn/000006_0</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>24516526&nbsp;&nbsp;&nbsp;
hdfs://master:54310/user/hive/warehouse/ra_md_syn/000007_0</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>4.</span><span =
style=3D'font-size:7.0pt;color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span><u><span style=3D'font-size:11.0pt;color:#1F497D'>hadoop fs -du
&lt;hdfs&nbsp;location of &nbsp;ra_ocs_syn&nbsp;&gt;</span></u><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>[hduser@master hadoop-0.20.203.0]$ bin/hadoop fs -du
/user/hive/warehouse/ra_ocs_syn</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Found 8 items</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>314639270&nbsp;&nbsp; =
hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000000_0</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>314639270&nbsp;&nbsp;
hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000001_0</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>304959363&nbsp;&nbsp;
hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000002_0</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>274374381&nbsp;&nbsp; =
hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000003_1</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>264694474&nbsp;&nbsp;
hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000004_0</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>257498693&nbsp;&nbsp;
hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000005_1</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>100334604&nbsp;&nbsp;
hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000006_0</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>41022170&nbsp;&nbsp;&nbsp; =
hdfs://master:54310/user/hive/warehouse/ra_ocs_syn/000007_0</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>5.</span><span =
style=3D'font-size:7.0pt;color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span><span =
style=3D'font-size:11.0pt;color:#1F497D'>hive-site.xml</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>[hduser@master ~]$ cat =
hive-0.8.1/conf/hive-site.xml</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&lt;?xml version=3D&quot;1.0&quot;?&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&lt;?xml-stylesheet type=3D&quot;text/xsl&quot;
href=3D&quot;configuration.xsl&quot;?&gt;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&lt;configuration&gt;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;name&gt;hive.metastore.local&lt;/name&gt;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;value&gt;true&lt;/value&gt;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;/property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;name&gt;javax.jdo.option.ConnectionURL&lt;/name&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;value&gt;jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=3D=
true&lt;/value&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;/property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;name&gt;javax.jdo.option.ConnectionDriverName&lt;/name&gt;</span><spa=
n
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;value&gt;com.mysql.jdbc.Driver&lt;/value&gt;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;/property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;name&gt;javax.jdo.option.ConnectionUserName&lt;/name&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;value&gt;hadoop&lt;/value&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;/property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;name&gt;javax.jdo.option.ConnectionPassword&lt;/name&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;value&gt;hadoop&lt;/value&gt;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;/property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;name&gt;hive.metastor=
e.sasl.enabled&lt;/name&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;value&gt;true&lt;/value&gt;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;description&gt;If true, the metastore thrift interface will be =
secured with
SASL. Clients must authenticate with =
Kerberos.&lt;/description&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;/property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;name&gt;hive.metastore.kerberos.keytab.file&lt;/name&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;value&gt;&lt;/value&gt;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;description&gt;The path to the Kerberos Keytab file containing the
metastore thrift server's service =
principal.&lt;/description&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;/property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;name&gt;hive.metastore.kerberos.principal&lt;/name&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;value&gt;<a href=3D"mailto:hduser/admin@EXAMPLE.COM%3c/value" =
target=3D"_blank">hduser/admin@EXAMPLE.COM&lt;/value</a>&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&lt;description&gt;The service principal for the metastore thrift =
server. The
special string _HOST will be replaced automatically with the correct =
host
name.&lt;/description&gt;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
&lt;/property&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<p class=3DMsoNormal style=3D'text-indent:.5in;background:white'><span
style=3D'font-size:11.0pt;color:black'>&lt;/configuration&gt;</span><span=

style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>6.</span><span =
style=3D'font-size:7.0pt;color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span><span style=3D'font-size:11.0pt;color:#1F497D'>Performing =
JOIN</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>hive&gt; set hive.optimize.bucketmapjoin =3D =
true;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>hive&gt; set hive.enforce.bucketing=3Dtrue;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>hive&gt; set
hive.input.format=3Dorg.apache.hadoop.hive.ql.io.BucketizedHiveInputForma=
t;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>hive&gt; select /*+ MAPJOIN(b) */ * from ra_md_syn a join
ra_ocs_syn b</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp; &gt; on (a.calling =3D b.calling) =
where&nbsp;
a.total_volume &lt;&gt; b.total_volume;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Total MapReduce jobs =3D 1</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>WARNING: org.apache.hadoop.metrics.jvm.EventCounter is =
deprecated.
Please use org.apache.hadoop.log.metrics.EventCounter in all the
log4j.properties files.</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Execution log at:
/tmp/hduser/hduser_20120409013131_da40d787-597d-490c-8558-9d10ec11e916.lo=
g</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:31:24&nbsp;&nbsp;&nbsp;&nbsp; Starting to =
launch
local task to process map join;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; maximum =
memory =3D
13&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;=
&nbsp;&nbsp;
98145024</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:31:28&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 200000&nbsp; Hashtable =
size:
199999&nbsp; Memory usage:&nbsp;&nbsp; 754&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&n=
bsp;05504&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.054</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:31:29&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 300000&nbsp; Hashtable =
size:
299999&nbsp; Memory usage:&nbsp;&nbsp;
111&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
540296&nbsp; rate:&nbsp;&nbsp; 0.08</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:31:32&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 400000&nbsp; Hashtable =
size:
399999&nbsp; Memory usage:&nbsp;&nbsp;
151&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
640080&nbsp; rate:&nbsp;&nbsp; 0.108</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:31:35&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 500000&nbsp; Hashtable =
size:
499999&nbsp; Memory usage:&nbsp;&nbsp;
185&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
503416&nbsp; rate:&nbsp;&nbsp; 0.133</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:31:37&nbsp;&nbsp; &nbsp;&nbsp;Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 600000&nbsp; Hashtable =
size:
599999&nbsp; Memory usage:&nbsp;&nbsp;
221&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
503440&nbsp; rate:&nbsp;&nbsp; 0.158</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:31:42&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 700000&nbsp; Hashtable =
size:
699999&nbsp; Memory usage:&nbsp;&nbsp;
257&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
484264&nbsp; rate:&nbsp;&nbsp; 0.184</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:31:47&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 800000&nbsp; Hashtable =
size:
799999&nbsp; Memory usage:&nbsp;&nbsp;
297&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
678568&nbsp; rate:&nbsp;&nbsp; 0.213</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:31:52&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 900000&nbsp; Hashtable =
size:
899999&nbsp; Memory usage:&nbsp;&nbsp;
333&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
678592&nbsp; rate:&nbsp;&nbsp; 0.239</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:31:57&nbsp;&nbsp;&nbsp;&nbsp; Processing =
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
1000000 Hashtable size: 999999&nbsp; Memory usage:&nbsp;&nbsp;
369&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
678568&nbsp; rate:&nbsp;&nbsp; 0.264</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:32:03&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1100000 Hashtable size: =
1099999
Memory usage:&nbsp;&nbsp;
405&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
678568&nbsp; rate:&nbsp;&nbsp; 0.29</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:32:09&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1200000 Hashtable size: =
1199999
Memory usage:&nbsp;&nbsp;
441&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
678592&nbsp; rate:&nbsp;&nbsp; 0.316</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:32:15&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1300000 Hashtable size: =
1299999
Memory usage:&nbsp;&nbsp;
477&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
678568&nbsp; rate:&nbsp;&nbsp; 0.342</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:32:23&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1400000 Hashtable size: =
1399999
Memory usage:&nbsp;&nbsp;
513&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;678592&nbsp; rate:&nbsp;&nbsp; =
0.367</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:32:29&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1500000 Hashtable size: =
1499999
Memory usage:&nbsp;&nbsp;
549&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
678568&nbsp; rate:&nbsp;&nbsp; 0.393</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:32:35&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1600000 Hashtable size: =
1599999
Memory usage:&nbsp;&nbsp;
602&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
455824&nbsp; rate:&nbsp;&nbsp; 0.431</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:32:45&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1700000 Hashtable size: =
1699999
Memory usage:&nbsp;&nbsp;
630&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
067176&nbsp; rate:&nbsp;&nbsp; 0.451</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:32:53&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1800000 Hashtable size: =
1799999
Memory usage:&nbsp;&nbsp;
666&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
067176&nbsp; rate:&nbsp;&nbsp; 0.476</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:33:01&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1900000 Hashtable size: =
1899999
Memory usage:&nbsp;&nbsp;
702&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
067200&nbsp; rate:&nbsp;&nbsp; 0.502</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:33:09&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2000000 Hashtable size: =
1999999
Memory usage:&nbsp;&nbsp; =
738&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
067176&nbsp; rate:&nbsp;&nbsp; 0.528</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:33:20&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2100000 Hashtable size: =
2099999
Memory usage:&nbsp;&nbsp; 774&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;254456&nbsp;
rate:&nbsp;&nbsp; 0.554</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:33:29&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2200000 Hashtable size: =
2199999
Memory usage:&nbsp;&nbsp;
810&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
067176&nbsp; rate:&nbsp;&nbsp; 0.579</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:33:38&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2300000 Hashtable size: =
2299999
Memory usage:&nbsp;&nbsp;
846&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
568480&nbsp; rate:&nbsp;&nbsp; 0.605</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:33:49&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2400000 Hashtable size: =
2399999
Memory usage:&nbsp;&nbsp;
882&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
096752&nbsp; rate:&nbsp;&nbsp; 0.631</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:33:59&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2500000 Hashtable size: =
2499999
Memory usage:&nbsp;&nbsp;
918&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
821920&nbsp; rate:&nbsp;&nbsp; 0.657</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:34:15&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2600000 Hashtable size: =
2599999
Memory usage:&nbsp;&nbsp;
954&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
134920&nbsp; rate:&nbsp;&nbsp; 0.682</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:34:26&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2700000 Hashtable size: =
2699999
Memory usage:&nbsp;&nbsp; =
990&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&=
nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;067168&nbsp;
rate:&nbsp;&nbsp; 0.708</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 01:34:38&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2800000 Hashtable size: =
2799999
Memory usage:&nbsp;&nbsp;
102&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbs=
p;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;
7113288 rate:&nbsp;&nbsp; 0.735</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Exception in thread &quot;Thread-2&quot; =
java.lang.OutOfMemoryError:
Java heap space</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.util.Arrays.copyOf(Arrays.java:2882)</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.lang.AbstractStringBuilder.expandCapacity(AbstractStringBuilder.java=
:100)</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.lang.AbstractStringBuilder.append(AbstractStringBuilder.java:597)</s=
pan><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.lang.StringBuilder.append(StringBuilder.java:212)</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
org.apache.hadoop.fs.FileSystem.closeAll(FileSystem.java:247)</span><span=

style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
org.apache.hadoop.fs.FileSystem$ClientFinalizer.run(FileSystem.java:232)<=
/span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Exception in thread &quot;Thread-1&quot; =
java.lang.OutOfMemoryError:
Java heap space</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.util.jar.Manifest$FastInputStream.&lt;init&gt;(Manifest.java:315)</s=
pan><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.util.jar.Manifest$FastInputStream.&lt;init&gt;(Manifest.java:310)</s=
pan><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.util.jar.Manifest.read(Manifest.java:178)</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; </span><span =
lang=3DFR
style=3D'font-size:11.0pt;color:black'>at
java.util.jar.Manifest.&lt;init&gt;(Manifest.java:52)</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span lang=3DFR =
style=3D'font-size:
11.0pt;color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.util.jar.JarFile.getManifestFromReference(JarFile.java:167)</span><s=
pan
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span lang=3DFR =
style=3D'font-size:
11.0pt;color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.util.jar.JarFile.getManifest(JarFile.java:148)</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span lang=3DFR =
style=3D'font-size:
11.0pt;color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; =
</span><span
style=3D'font-size:11.0pt;color:black'>at
sun.misc.URLClassPath$JarLoader$2.getManifest(URLClassPath.java:696)</spa=
n><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.net.URLClassLoader.defineClass(URLClassLoader.java:228)</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.net.URLClassLoader.access$000(URLClassLoader.java:58)</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.net.URLClassLoader$1.run(URLClassLoader.java:197)</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at =
java.security.AccessController.doPrivileged(Native
Method)</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.net.URLClassLoader.findClass(URLClassLoader.java:190)</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.lang.ClassLoader.loadClass(ClassLoader.java:306)</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:301)</span><span=

style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
java.lang.ClassLoader.loadClass(ClassLoader.java:247)</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at
org.apache.hadoop.util.RunJar$1.run(RunJar.java:126)</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Execution failed with exit status: 2</span><span =
style=3D'color:
black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Obtaining error information</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Task failed!</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Task ID:</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp; Stage-3</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Logs:</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>/tmp/hduser/hive.log</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>FAILED: Execution Error, return code 2 from
org.apache.hadoop.hive.ql.exec.MapredLocalTask</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>7.</span><span =
style=3D'font-size:7.0pt;color:#1F497D'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span><span =
style=3D'font-size:11.0pt;color:#1F497D'>/tmp/hduser/hive.log</span><span=

style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 02:00:10,654 ERROR DataNucleus.Plugin
(Log4JLogger.java:error(115)) - Bundle &quot;org.eclipse.jdt.core&quot;
requires &quot;org.eclipse.core.resources&quot; but it cannot be =
resolved.</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 02:00:10,654 ERROR DataNucleus.Plugin
(Log4JLogger.java:error(115)) - Bundle &quot;org.eclipse.jdt.core&quot;
requires &quot;org.eclipse.core.resources&quot; but it cannot be =
resolved.</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 02:00:10,657 ERROR DataNucleus.Plugin
(Log4JLogger.java:error(115)) - Bundle &quot;org.eclipse.jdt.core&quot;
requires &quot;org.eclipse.core.runtime&quot; but it cannot be =
resolved.</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 02:00:10,657 ERROR DataNucleus.Plugin
(Log4JLogger.java:error(115)) - Bundle &quot;org.eclipse.jdt.core&quot;
requires &quot;org.eclipse.core.runtime&quot; but it cannot be =
resolved.</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 02:00:10,657 ERROR DataNucleus.Plugin
(Log4JLogger.java:error(115)) - Bundle &quot;org.eclipse.jdt.core&quot;
requires &quot;org.eclipse.text&quot; but it cannot be =
resolved.</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 02:00:10,657 ERROR DataNucleus.Plugin
(Log4JLogger.java:error(115)) - Bundle &quot;org.eclipse.jdt.core&quot;
requires &quot;org.eclipse.text&quot; but it cannot be =
resolved.</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 02:00:12,796 WARN&nbsp; parse.SemanticAnalyzer
(SemanticAnalyzer.java:genBodyPlan(5821)) - Common Gby =
keys:null</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 02:09:02,356 ERROR exec.Task
(SessionState.java:printError(380)) - Execution failed with exit status: =
2</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 02:09:02,357 ERROR exec.Task
(SessionState.java:printError(380)) - Obtaining error =
information</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 02:09:02,358 ERROR exec.Task
(SessionState.java:printError(380)) -</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Task failed!</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Task ID:</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp; Stage-3</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>Logs:</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 02:09:02,358 ERROR exec.Task
(SessionState.java:printError(380)) - /tmp/hduser/hive.log</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 02:09:02,359 ERROR exec.MapredLocalTask
(MapredLocalTask.java:execute(228)) - Execution failed with exit status: =
2</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>2012-04-09 02:09:02,377 ERROR ql.Driver
(SessionState.java:printError(380)) - FAILED: Execution Error, return =
code 2
from org.apache.hadoop.hive.ql.exec.MapredLocalTask</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:1.0in'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><i><span =
style=3D'font-size:10.0pt;
color:#1F497D'>Best regards</span></i><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:#E36C0A'>Nguyen Thanh Binh =
(Mr)</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:#548DD4'>Cell phone: =
(+84)</span><span
style=3D'font-size:10.0pt;font-family:"Arial","sans-serif";color:red'>98.=
226.0622</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div style=3D'border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt =
0in 0in 0in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><b><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>From:</span></b><span
style=3D'font-size:10.0pt;font-family:"Arial","sans-serif";color:black'> =
Bejoy Ks
[<a href=3D"mailto:bejoy_ks@yahoo.com" =
target=3D"_blank">mailto:bejoy_ks@yahoo.com</a>]
<br>
<b>Sent:</b> Friday, April 06, 2012 11:33 PM<br>
<b>To:</b> <a href=3D"mailto:user@hive.apache.org" =
target=3D"_blank">user@hive.apache.org</a><br>
<b>Subject:</b> Re: Why BucketJoinMap consume too much =
memory</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>Hi Binh,</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp; &nbsp; &nbsp; =
&nbsp; From
the information you provided bucketed map join should be posible. I'm =
clueless
now, but still I can make one more try, if you could provide me the =
output of
the following</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-family:"Arial","sans-serif";
color:black'>1) Describe Formatted&nbsp;ra_md_syn;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-family:"Arial","sans-serif";
color:black'>2) Describe Formatted&nbsp;ra_ocs_syn.</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>3) hadoop fs -du &lt;hdfs
location of&nbsp;ra_ocs_syn&nbsp;&gt;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>4) hadoop fs -du
&lt;hdfs&nbsp;location of &nbsp;ra_md_syn&nbsp;&gt;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>5) perform the join and =
paste the
full console log along with the query. (with all the properties set at =
CLI)</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>6) your =
hive-site.xml</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>@Alex</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp; &nbsp; &nbsp; =
&nbsp;You
can use non equality conditions in the where clause. Only the ON =
conditions
should be equality ones.</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-family:"Arial","sans-serif";
color:black'>Regards</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-family:"Arial","sans-serif";
color:black'>Bejoy KS</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<div class=3DMsoNormal align=3Dcenter =
style=3D'text-align:center;background:white'><span
style=3D'font-size:10.0pt;font-family:"Arial","sans-serif";color:black'>

<hr size=3D1 width=3D"100%" align=3Dcenter>

</span></div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><b><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>From:</span></b><span
style=3D'font-size:10.0pt;font-family:"Arial","sans-serif";color:black'> =
gemini
alex &lt;<a href=3D"mailto:gemini5201314@gmail.com" =
target=3D"_blank">gemini5201314@gmail.com</a>&gt;<br>
<b>To:</b> <a href=3D"mailto:user@hive.apache.org" =
target=3D"_blank">user@hive.apache.org</a>
<br>
<b>Cc:</b> Bejoy Ks &lt;<a href=3D"mailto:bejoy_ks@yahoo.com" =
target=3D"_blank">bejoy_ks@yahoo.com</a>&gt;
<br>
<b>Sent:</b> Friday, April 6, 2012 12:36 PM<br>
<b>Subject:</b> Re: Why BucketJoinMap consume too much =
memory</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div style=3D'margin-bottom:12.0pt'>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

<div id=3Dyiv675319147>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>I guess
the problem is you can't using &lt;&gt; predicate in bucket join, try =
to&nbsp;<o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>select
c.* from (<o:p></o:p></span></p>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>select /*+ MAPJOIN(b) */
a.calling calling ,a.</span><span style=3D'color:black'> </span><span
style=3D'font-size:10.0pt;font-family:"Arial","sans-serif";color:black'>t=
otal_volume&nbsp;atotal_volume&nbsp;</span><span
style=3D'color:black'>, b.total_volume btotal_volume&nbsp;</span><span
style=3D'font-size:10.0pt;font-family:"Arial","sans-serif";color:black'>f=
rom
ra_md_syn a join ra_ocs_syn b</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
font-family:"Arial","sans-serif";color:black'>&nbsp; &nbsp; &nbsp;on =
(a.calling
=3D b.calling) ) c where c.atotal_volumn&lt;&gt;c.btotal_volume =
;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-family:"MS Mincho";
color:black'>=E5=9C=A8</span><span style=3D'color:black'> =
2012</span><span
style=3D'font-family:"MS Mincho";color:black'>=E5=B9=B4</span><span =
style=3D'color:black'>4</span><span
style=3D'font-family:"MS Mincho";color:black'>=E6=9C=88</span><span =
style=3D'color:black'>6</span><span
style=3D'font-family:"MS Mincho";color:black'>=E6=97=A5</span><span =
style=3D'color:black'> </span><span
style=3D'font-family:"MS =
Mincho";color:black'>=E4=B8=8A=E5=8D=88</span><span =
style=3D'color:black'>9:19</span><span
style=3D'font-family:"MS Mincho";color:black'>=EF=BC=8C</span><span =
style=3D'color:black'>binhnt22
&lt;<a href=3D"mailto:Binhnt22@viettel.com.vn" =
target=3D"_blank">Binhnt22@viettel.com.vn</a>&gt;</span><span
style=3D'font-family:"MS =
Mincho";color:black'>=E5=86=99=E9=81=93=EF=BC=9A</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>Hi Bejoy,</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>Sorry for late response. I will start to demonstrate over =
again
to clear some information.</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>I have 2 tables, nearly same. Both has the same table =
structure,
65m records, 2GB size (same size).</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>hive&gt; describe ra_md_syn;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>OK</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>calling string</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>total_duration&nbsp; bigint</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>total_volume&nbsp;&nbsp;&nbsp; bigint</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>total_charge&nbsp;&nbsp;&nbsp; bigint</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>Both of them were bucketized into 256 buckets on =
=E2=80=98calling=E2=80=99
column (in the last time only 10 buckets, I tried to increase it as you
suggested). And I want to find all =E2=80=98calling=E2=80=99 exists in =
both tables but
different =E2=80=98total_volume=E2=80=99</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>The script as you knew:</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>hive&gt; set hive.optimize.bucketmapjoin =3D =
true;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>hive&gt; set hive.enforce.bucketing=3Dtrue;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>hive&gt; set
hive.input.format=3Dorg.apache.hadoop.hive.ql.io.CombineHiveInputFormat;<=
/span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>hive&gt; select /*+ MAPJOIN(b) */ * from ra_md_syn a join
ra_ocs_syn b</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div style=3D'margin-left:.5in'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp;&nbsp;&nbsp; &gt; on (a.calling =3D b.calling) =
where&nbsp;
a.total_volume &lt;&gt; b.total_volume;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>And the result was exactly in my last email. Java heap =
space
error. With total size is only 2GB and 256 buckets, I think bucket size =
is
impossible to be the issue here.</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>Please give me some advice, I really =
appreciate</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><i><span =
style=3D'font-size:10.0pt;
color:#1F497D'>Best regards</span></i><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:#E36C0A'>Nguyen Thanh Binh (Mr)</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:#548DD4'>Cell phone: (+84)</span><span style=3D'font-size:10.0pt;
color:red'>98.226.0622</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div style=3D'border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt =
0in 0in 0in'>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><b><span =
style=3D'font-size:10.0pt;
color:black'>From:</span></b><span =
style=3D'font-size:10.0pt;color:black'> Bejoy
Ks [mailto:<a href=3D"mailto:bejoy_ks@yahoo.com" =
target=3D"_blank">bejoy_ks@yahoo.com</a>]
<br>
<b>Sent:</b> Thursday, April 05, 2012 7:23 PM</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'><br>
<b>To:</b> <a href=3D"mailto:user@hive.apache.org" =
target=3D"_blank">user@hive.apache.org</a><br>
<b>Subject:</b> Re: Why BucketJoinMap consume too much =
memory<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>Hi Binh</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp; &nbsp; I was just checking your local map join log , =
and I
noticed two things&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>- the memory usage by one hash table has got beyond =
1G.&nbsp;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>- Number of rows processed is just 2M</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>It is possible that, Each&nbsp;bucket&nbsp;it self is too =
large to
be loaded in&nbsp;memory.</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>As a work around or to nail down the bucket size is the =
issue
here, can you try increasing the number of buckets to 100 and try doing =
a
bucketed map join.</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>Also you mentioned the data size is 2Gb, is it the =
compressed data
size?</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.5pt;
color:#1F497D'>2012-04-05 10:41:07&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <span =
style=3D'background:yellow'>2,900,000</span>
Hashtable size: 2899999 Memory usage:&nbsp;&nbsp; <span =
style=3D'background:yellow'>1,062,065,576&nbsp;</span>&nbsp;&nbsp;&nbsp;&=
nbsp;
rate:&nbsp;&nbsp; 0.76</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.5pt;
color:black;background:white'>Regards</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.5pt;
color:black;background:white'>Bejoy KS</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div class=3DMsoNormal align=3Dcenter =
style=3D'text-align:center;background:white'><span
style=3D'font-size:10.0pt;color:black'>

<hr size=3D1 width=3D"100%" align=3Dcenter>

</span></div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><b><span =
style=3D'font-size:10.0pt;
color:black'>From:</span></b><span =
style=3D'font-size:10.0pt;color:black'> Nitin
Pawar &lt;<a href=3D"mailto:nitinpawar432@gmail.com" =
target=3D"_blank">nitinpawar432@gmail.com</a>&gt;<br>
<b>To:</b> <a href=3D"mailto:user@hive.apache.org" =
target=3D"_blank">user@hive.apache.org</a>
<br>
<b>Sent:</b> Thursday, April 5, 2012 5:03 PM<br>
<b>Subject:</b> Re: Why BucketJoinMap consume too much =
memory</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div style=3D'margin-bottom:12.0pt'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>Can you
tell me the size of table b?&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div style=3D'margin-bottom:12.0pt'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>If you
are doing bucketing and still size b table is huge then it will reach =
this
problem<o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>On Thu,
Apr 5, 2012 at 4:22 PM, binhnt22 &lt;<a =
href=3D"mailto:Binhnt22@viettel.com.vn"
target=3D"_blank">Binhnt22@viettel.com.vn</a>&gt; =
wrote:<o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>Thank Nitin,</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>I tried but no luck. Here=E2=80=99s hive log, please =
spend a little time
to view it.</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>hive&gt; set hive.optimize.bucketmapjoin =3D =
true;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>hive&gt; set hive.enforce.bucketing=3Dtrue;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>hive&gt; set
hive.input.format=3Dorg.apache.hadoop.hive.ql.io.CombineHiveInputFormat;<=
/span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>hive&gt; select /*+ MAPJOIN(b) */ * from ra_md_syn a join
ra_ocs_syn b</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;&nbsp;&nbsp; &gt; on (a.calling =3D b.calling) =
where&nbsp;
a.total_volume &lt;&gt; b.total_volume;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>Total MapReduce jobs =3D 1</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>WARNING: org.apache.hadoop.metrics.jvm.EventCounter is
deprecated. Please use org.apache.hadoop.log.metrics.EventCounter in all =
the
log4j.properties files.</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>Execution log at:
/tmp/hduser/hduser_20120405103737_28ef26fe-a202-4047-b5ca-c40d9e3ad36c.lo=
g</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:37:45&nbsp;&nbsp;&nbsp;&nbsp; Starting to =
launch
local task to process map join;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; maximum =
memory =3D
1398145024</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:37:48&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 200000 &nbsp;Hashtable =
size:
199999&nbsp; Memory usage:&nbsp;&nbsp;
75403880&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.054</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:37:50&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 300000&nbsp; Hashtable =
size:
299999&nbsp; Memory usage:&nbsp;&nbsp;
111404664&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.08</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:37:54&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 400000&nbsp; Hashtable =
size:
399999&nbsp; Memory usage:&nbsp;&nbsp;
151598960&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.108</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:38:04&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 500000&nbsp; Hashtable =
size:
499999&nbsp; Memory usage:&nbsp;&nbsp;
185483368&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.133</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:38:09&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 600000&nbsp; Hashtable =
size:
599999&nbsp; Memory usage:&nbsp;&nbsp;
221483392&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.158</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:38:13&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 700000&nbsp; Hashtable =
size:
699999&nbsp; Memory usage:&nbsp;&nbsp;
257482640&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.184</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:38:19&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 800000&nbsp; Hashtable =
size:
799999&nbsp; Memory usage:&nbsp;&nbsp;
297676944&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.213</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:38:22&nbsp;&nbsp;&nbsp;&nbsp; Processing =
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
900000&nbsp; Hashtable size: 899999&nbsp; Memory usage:&nbsp;&nbsp;
333676968&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.239</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:38:27&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1000000 Hashtable size:
999999&nbsp; Memory usage:&nbsp;&nbsp;
369676944&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.264</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:38:31&nbsp;&nbsp;&nbsp;&nbsp; Processing =
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
1100000 Hashtable size: 1099999 Memory usage:&nbsp;&nbsp;
405676968&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.29</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:38:36&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1200000 Hashtable size: =
1199999
Memory usage:&nbsp;&nbsp; 441676944&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.316</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:38:42&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1300000 Hashtable size: =
1299999
Memory usage:&nbsp;&nbsp; 477676944&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.342</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:38:47&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1400000 Hashtable size: =
1399999
Memory usage:&nbsp;&nbsp; 513676968&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.367</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:38:52&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1500000 Hashtable size: =
1499999
Memory usage:&nbsp;&nbsp; 549676944&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.393</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:39:00&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1600000 Hashtable size: =
1599999
Memory usage:&nbsp;&nbsp; 602454200&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.431</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:39:08&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1700000 Hashtable size: =
1699999
Memory usage:&nbsp;&nbsp; 630065552&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.451</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:39:14&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1800000 Hashtable size: =
1799999
Memory usage:&nbsp;&nbsp; 666065552&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.476</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:39:20&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1900000 Hashtable size: =
1899999
Memory usage:&nbsp;&nbsp; 702065552&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.502</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:39:26&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2000000 Hashtable size: =
1999999
Memory usage:&nbsp;&nbsp; 738065576&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.528</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:39:36&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2100000 Hashtable size: =
2099999
Memory usage:&nbsp;&nbsp; 774065552&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.554</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:39:43&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2200000 Hashtable size: =
2199999
Memory usage:&nbsp;&nbsp; 810065552&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.579</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:39:51&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2300000 Hashtable size: =
2299999
Memory usage:&nbsp;&nbsp; 846065576&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.605</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:40:16&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2400000 Hashtable size: =
2399999
Memory usage:&nbsp;&nbsp; 882085136&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.631</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:40:24&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2500000 Hashtable size: =
2499999
Memory usage:&nbsp;&nbsp; 918085208&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.657</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:40:39&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2600000 Hashtable size: =
2599999
Memory usage:&nbsp;&nbsp; 954065544&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.682</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:40:48&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2700000 Hashtable size: =
2699999
Memory usage:&nbsp;&nbsp; 990065568&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.708</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:40:56&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2800000 Hashtable size: =
2799999
Memory usage:&nbsp;&nbsp; 1026065552&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;rate:&nbsp;&nbsp; 0.734</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>2012-04-05 10:41:07&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2900000 Hashtable size: =
2899999
Memory usage:&nbsp;&nbsp; 1062065576&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.76</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>Exception in thread &quot;Thread-1&quot;
java.lang.OutOfMemoryError: Java heap space</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><i><span =
style=3D'font-size:10.0pt;
color:#1F497D'>Best regards</span></i><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:#E36C0A'>Nguyen Thanh Binh (Mr)</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:#548DD4'>Cell phone: (+84)</span><span style=3D'font-size:10.0pt;
color:red'>98.226.0622</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div style=3D'border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt =
0in 0in 0in'>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><b><span =
style=3D'font-size:10.0pt;
color:black'>From:</span></b><span =
style=3D'font-size:10.0pt;color:black'> Nitin
Pawar [mailto:<a href=3D"mailto:nitinpawar432@gmail.com" =
target=3D"_blank">nitinpawar432@gmail.com</a>]
<br>
<b>Sent:</b> Thursday, April 05, 2012 5:36 PM</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'><br>
<b>To:</b> <a href=3D"mailto:user@hive.apache.org" =
target=3D"_blank">user@hive.apache.org</a><br>
<b>Subject:</b> Re: Why BucketJoinMap consume too much =
memory<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>can you
try adding these settings&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>set
hive.enforce.bucketing=3Dtrue;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>hive.input.format=3Dorg.apache.hadoop.hive.ql.io.Co=
mbineHiveInputFormat;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>I have
tried bucketing with 1000 buckets and with more than 1TB data tables .. =
they do
go through fine&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div style=3D'margin-bottom:12.0pt'>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>On Thu,
Apr 5, 2012 at 3:37 PM, binhnt22 &lt;<a =
href=3D"mailto:Binhnt22@viettel.com.vn"
target=3D"_blank">Binhnt22@viettel.com.vn</a>&gt; =
wrote:<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>Hi Bejoy,</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>Both my tables has 65m records ( ~ 1.8-1.9GB on hadoop) =
and
bucketized on =E2=80=98calling=E2=80=99 column into 10 =
buckets.</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>As you said, hive will load only 1 bucket ~ 180-190MB =
into
memory. That=E2=80=99s hardly to blow the heap (1.3GB)</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>According to wiki, I set:</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp; set
hive.input.format=3Dorg.apache.hadoop.hive.ql.io.BucketizedHiveInputForma=
t;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp; set hive.optimize.bucketmapjoin =3D =
true;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp; set hive.optimize.bucketmapjoin.sortedmerge =3D =
true;</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>And run the following SQL</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>select /*+ MAPJOIN(a) */ * from ra_md_cdr_ggsn_synthetic a =
join
ra_ocs_cdr_ggsn_synthetic b </span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>on (a.calling =3D b.calling) where&nbsp; a.total_volume =
&lt;&gt;
b.total_volume;</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>But it still created many hash tables then threw Java =
Heap space
error</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><i><span =
style=3D'font-size:10.0pt;
color:#1F497D'>Best regards</span></i><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:#E36C0A'>Nguyen Thanh Binh (Mr)</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:#548DD4'>Cell phone: (+84)</span><span style=3D'font-size:10.0pt;
color:red'>98.226.0622</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:#1F497D'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div style=3D'border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt =
0in 0in 0in'>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><b><span =
style=3D'font-size:10.0pt;
color:black'>From:</span></b><span =
style=3D'font-size:10.0pt;color:black'> Bejoy
Ks [mailto:<a href=3D"mailto:bejoy_ks@yahoo.com" =
target=3D"_blank">bejoy_ks@yahoo.com</a>]
<br>
<b>Sent:</b> Thursday, April 05, 2012 3:07 PM<br>
<b>To:</b> <a href=3D"mailto:user@hive.apache.org" =
target=3D"_blank">user@hive.apache.org</a></span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'><br>
<b>Subject:</b> Re: Why BucketJoinMap consume too much =
memory<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>Hi Amit</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp; &nbsp; &nbsp; Sorry for the delayed response, had a
terrible schedule. AFAIK, there is no flags that would help you to take =
the
hash table creation, compression and load into tmp files away from =
client
node.&nbsp;</span><span style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp; &nbsp; &nbsp; From my understanding if you use a Map =
side
join, the small table as a whole is converted into a hash table and =
compressed in
a tmp file. Say if your child jvm size is 1gb and this small table is =
5GB, it'd
blow off jour job if the map tasks tries to get such a huge file in =
memory.
Bucketed map join can help here, if the table is bucketed ,say 100 =
buckets then
each bucket may have around 50mb of data. ie one tmp file would be just =
less
that 50mb, here mapper needs to load only the required buckets
in&nbsp;memory&nbsp;and thus hardly run =
into&nbsp;memory&nbsp;issues.</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp; &nbsp; Also on the client, The records are processed =
bucket
by bucket&nbsp;and loaded into tmp files. So if your bucket size is too =
large,
than the heap size specified for your client, it'd throw an out of =
memory.</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>Regards</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>Bejoy KS</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:10.0pt;
color:black'>&nbsp;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div class=3DMsoNormal align=3Dcenter =
style=3D'text-align:center;background:white'><span
style=3D'font-size:10.0pt;color:black'>

<hr size=3D1 width=3D"100%" align=3Dcenter>

</span></div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><b><span =
style=3D'font-size:10.0pt;
color:black'>From:</span></b><span =
style=3D'font-size:10.0pt;color:black'> Amit
Sharma &lt;<a href=3D"mailto:amitsharma1708@gmail.com" =
target=3D"_blank">amitsharma1708@gmail.com</a>&gt;<br>
<b>To:</b> <a href=3D"mailto:user@hive.apache.org" =
target=3D"_blank">user@hive.apache.org</a>;
Bejoy Ks &lt;<a href=3D"mailto:bejoy_ks@yahoo.com" =
target=3D"_blank">bejoy_ks@yahoo.com</a>&gt;
<br>
<b>Sent:</b> Tuesday, April 3, 2012 11:06 PM<br>
<b>Subject:</b> Re: Why BucketJoinMap consume too much =
memory</span><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div style=3D'margin-bottom:12.0pt'>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div style=3D'margin-bottom:12.0pt'>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>I am
experiencing similar behavior in my queries. All the conditions for =
bucketed
map join are met, and the only difference in execution when i set the
hive.optimize.bucketmapjoin flag to true, is that instead of a single =
hash
table, multiple hash tables are created. All the Hash Tables are still =
created
on the client side and loaded into tmp files, which are then distributed =
to the
mappers using distributed cache.<br>
<br>
Can i find any example anywhere, which shows behavior of bucketed map =
join,
where in it does not create the has tables on the client itself? If so, =
is
there a flag for it?<br>
<br>
Thanks,<br>
Amit<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>On Sun,
Apr 1, 2012 at 12:35 PM, Bejoy Ks &lt;<a =
href=3D"mailto:bejoy_ks@yahoo.com"
target=3D"_blank">bejoy_ks@yahoo.com</a>&gt; =
wrote:<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>Hi<br>
&nbsp;&nbsp;&nbsp;&nbsp;On a first look, it seems like map join is =
happening in
your case other than bucketed map join. The following conditions need to =
hold
for bucketed map join to work<br>
1) Both the tables are bucketed on the join columns<br>
2) The number of buckets in each table should be multiples of each =
other<br>
3) Ensure that the table has enough number of buckets <br>
<br>
Note: If the data is large say 1TB(per table) and if you have just a few
buckets say 100 buckets, each mapper may have to load 10GB&gt;. This =
would
definitely blow your jvm . Bottom line is ensure your mappers are not =
heavily
loaded with the bucketed data distribution.<br>
<br>
Regards<br>
Bejoy.K.S<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div class=3DMsoNormal align=3Dcenter =
style=3D'text-align:center;background:white'><span
style=3D'color:black'>

<hr size=3D1 width=3D"100%" align=3Dcenter>

</span></div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><b><span =
style=3D'color:black'>From:</span></b><span
style=3D'color:black'> binhnt22 &lt;<a =
href=3D"mailto:Binhnt22@viettel.com.vn"
target=3D"_blank">Binhnt22@viettel.com.vn</a>&gt;<br>
<b>To:</b> <a href=3D"mailto:user@hive.apache.org" =
target=3D"_blank">user@hive.apache.org</a>
<br>
<b>Sent:</b> Saturday, March 31, 2012 6:46 AM<br>
<b>Subject:</b> Why BucketJoinMap consume too much =
memory<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>I&nbsp;
have 2 table, each has 6 million records and clustered into 10 =
buckets<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>These
tables are very simple with 1 key column and 1 value column, all I want =
is
getting the key that exists in both table but different =
value.<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>The
normal did the trick, took only 141 secs.<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>select * from ra_md_cdr_ggsn_synthetic a join
ra_ocs_cdr_ggsn_synthetic b on (a.calling =3D b.calling) where&nbsp;
a.total_volume &lt;&gt; b.total_volume;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>I tried
to use bucket join map by setting:&nbsp;&nbsp; </span><i><span
style=3D'font-size:11.0pt;color:black'>set hive.optimize.bucketmapjoin =
=3D true</span></i><span
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'font-size:11.0pt;
color:black'>select /*+ MAPJOIN(a) */ * from ra_md_cdr_ggsn_synthetic a =
join
ra_ocs_cdr_ggsn_synthetic b on (a.calling =3D b.calling) where&nbsp;
a.total_volume &lt;&gt; b.total_volume;</span><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:35:09&nbsp;&nbsp;&nbsp;&nbsp; Starting to launch local task to =
process map
join;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; maximum memory =3D =
1398145024<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:35:12&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 200000&nbsp; Hashtable =
size:
199999&nbsp; Memory usage:&nbsp;&nbsp;
86646704&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.062<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:35:15&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 300000&nbsp; Hashtable =
size:
299999&nbsp; Memory usage:&nbsp;&nbsp;
128247464&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.092<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:35:18&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 400000&nbsp; Hashtable =
size:
399999&nbsp; Memory usage:&nbsp;&nbsp;
174041744&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.124<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:35:21&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 500000&nbsp; Hashtable =
size:
499999&nbsp; Memory usage:&nbsp;&nbsp;
214140840&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.153<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:35:25&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 600000&nbsp; Hashtable =
size:
599999&nbsp; Memory usage:&nbsp;&nbsp;
255181504&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.183<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:35:29&nbsp;&nbsp;&nbsp;&nbsp; Processing =
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
700000&nbsp; Hashtable size: 699999&nbsp; Memory usage:&nbsp;&nbsp;
296744320&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.212<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:35:35&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 800000&nbsp; Hashtable =
size:
799999&nbsp; Memory usage:&nbsp;&nbsp;
342538616&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.245<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:35:38&nbsp;&nbsp;&nbsp;&nbsp; Processing =
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
900000&nbsp; Hashtable size: 899999&nbsp; Memory usage:&nbsp;&nbsp;
384138552&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.275<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:35:45&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1000000 Hashtable size:
999999&nbsp; Memory usage:&nbsp;&nbsp;
425719576&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate:&nbsp;&nbsp; =
0.304<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:35:50&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1100000 Hashtable size: =
1099999
Memory usage:&nbsp;&nbsp; 467319576&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.334<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:35:56&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1200000 Hashtable size: =
1199999
Memory usage:&nbsp;&nbsp; 508940504&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.364<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:36:04&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1300000 Hashtable size: =
1299999
Memory usage:&nbsp;&nbsp; 550521128&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.394<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:36:09&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1400000 Hashtable size: =
1399999
Memory usage:&nbsp;&nbsp; 592121128&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.424<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:36:15&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1500000 Hashtable size: =
1499999
Memory usage:&nbsp;&nbsp; 633720336&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.453<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:36:22&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1600000 Hashtable size: =
1599999
Memory usage:&nbsp;&nbsp; 692097568&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.495<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:36:33&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1700000 Hashtable size: =
1699999
Memory usage:&nbsp;&nbsp; 725308944&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.519<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:36:40&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1800000 Hashtable size: =
1799999
Memory usage:&nbsp;&nbsp; 766946424&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.549<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:36:48&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1900000 Hashtable size: =
1899999
Memory usage:&nbsp;&nbsp; 808527928&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.578<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:36:55&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2000000 Hashtable size: =
1999999
Memory usage:&nbsp;&nbsp; 850127928&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.608<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:37:08&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2100000 Hashtable size: =
2099999
Memory usage:&nbsp;&nbsp; 891708856&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.638<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:37:16 &nbsp;&nbsp;&nbsp;&nbsp;Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2200000 Hashtable size: =
2199999
Memory usage:&nbsp;&nbsp; 933308856&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.668<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:37:25&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2300000 Hashtable size: =
2299999
Memory usage:&nbsp;&nbsp; 974908856&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.697<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:37:34&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2400000 Hashtable size: =
2399999
Memory usage:&nbsp;&nbsp; 1016529448&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.727<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:37:43&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2500000 Hashtable size: =
2499999
Memory usage:&nbsp;&nbsp; 1058129496&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.757<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>2012-03-30
11:37:58&nbsp;&nbsp;&nbsp;&nbsp; Processing
rows:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2600000 Hashtable size: =
2599999
Memory usage:&nbsp;&nbsp; 1099708832&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
rate:&nbsp;&nbsp; 0.787<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>Exception
in thread &quot;Thread-1&quot; java.lang.OutOfMemoryError: Java heap =
space<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>My system
has 4 PC, each has CPU E2180, 2GB ram, 80GB HDD, one of them containts
NameNode, JobTracker, Hive Server and all of them contain DataNode, =
TaskTracker<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>In all
node, I set: </span><span style=3D'font-size:9.0pt;color:black'>export
HADOOP_HEAPSIZE=3D1500 </span><span style=3D'color:black'>in =
hadoop-env.sh (~ 1.3GB
heap)<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>I want to
ask you experts, why bucket join map consume too much memory? Am I wrong =
or my
configuration is bad?<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><i><span =
style=3D'font-size:10.0pt;
color:#17365D'>Best regards,</span></i><span =
style=3D'color:black'><o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

<div style=3D'margin-bottom:12.0pt'>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div style=3D'margin-bottom:12.0pt'>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'><br>
<br clear=3Dall>
<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div style=3D'margin-bottom:12.0pt'>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>-- <br>
Nitin Pawar<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'><br>
<br clear=3Dall>
<o:p></o:p></span></p>

</div>

</div>

</div>

<div>

<div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div style=3D'margin-bottom:12.0pt'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>-- <br>
Nitin Pawar<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

<div style=3D'margin-bottom:12.0pt'>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

<div>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

<div style=3D'margin-bottom:12.0pt'>

<div>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

<div style=3D'margin-bottom:12.0pt'>

<p class=3DMsoNormal style=3D'background:white'><span =
style=3D'color:black'>&nbsp;<o:p></o:p></span></p>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

<p class=3DMsoNormal =
style=3D'margin-bottom:12.0pt;background:white'><span
style=3D'color:black'><o:p>&nbsp;</o:p></span></p>

</div>

</div>

</div>

</div>

</body>

</html>

--Boundary_(ID_Xs6DU59ehoTRUXpe5DR+0g)--