Mailing-List: contact user-help@hive.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@hive.apache.org
Subject: Re: Error selecting from a Hive ORC table in Spark-sql
MIME-Version: 1.0
From: Eugene Koifman <ekoifman@hortonworks.com>
To: "user@hive.apache.org" <user@hive.apache.org>, "user @spark"
	<user@spark.apache.org>
Thread-Topic: Error selecting from a Hive ORC table in Spark-sql
Thread-Index: AQHRg5A+0txTg7Fg5EuECToMyJp+yJ9kLfWA
Date: Mon, 21 Mar 2016 17:53:17 +0000
Message-ID: <D315815E.4B51A%ekoifman@hortonworks.com>
In-Reply-To: 
 <CAJ3fcbBYS3uakhh36wvPHqKbk66dxR9fbEYq9LZgFricE7A7yQ@mail.gmail.com>
Accept-Language: en-US
Content-Language: en-US
x-ms-exchange-messagesentrepresentingtype: 1
x-ms-exchange-transport-fromentityheader: Hosted
x-originating-ip: [192.175.27.10]
x-source-routing-agent: Processed
Content-Type: multipart/alternative;
	boundary="_000_D315815E4B51Aekoifmanhortonworkscom_"

--_000_D315815E4B51Aekoifmanhortonworkscom_
Content-Type: text/plain; charset="Windows-1252"
Content-Transfer-Encoding: quoted-printable

The system thinks t2 is an Acid table but the files on disk don=92t follow =
the convention acid system would expect.
Perhaps Xuefu Zhang would know more on Spark/Aicd integration.

From: Mich Talebzadeh <mich.talebzadeh@gmail.com<mailto:mich.talebzadeh@gma=
il.com>>
Reply-To: "user@hive.apache.org<mailto:user@hive.apache.org>" <user@hive.ap=
ache.org<mailto:user@hive.apache.org>>
Date: Monday, March 21, 2016 at 9:39 AM
To: "user @spark" <user@spark.apache.org<mailto:user@spark.apache.org>>, us=
er <user@hive.apache.org<mailto:user@hive.apache.org>>
Subject: Error selecting from a Hive ORC table in Spark-sql

Hi,

Do we know the cause of this error when selecting from an Hive ORC table

spark-sql> select * from t2;
16/03/21 16:38:33 ERROR SparkSQLDriver: Failed in [select * from t2]
java.lang.RuntimeException: serious problem
        at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat.generateSplitsIn=
fo(OrcInputFormat.java:1021)
        at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat.getSplits(OrcInp=
utFormat.java:1048)
        at org.apache.spark.rdd.HadoopRDD.getPartitions(HadoopRDD.scala:207=
)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
39)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
37)
        at scala.Option.getOrElse(Option.scala:120)
        at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)
        at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartition=
sRDD.scala:35)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
39)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
37)
        at scala.Option.getOrElse(Option.scala:120)
        at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)
        at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartition=
sRDD.scala:35)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
39)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
37)
        at scala.Option.getOrElse(Option.scala:120)
        at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)
        at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartition=
sRDD.scala:35)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
39)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
37)
        at scala.Option.getOrElse(Option.scala:120)
        at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)
        at org.apache.spark.SparkContext.runJob(SparkContext.scala:1921)
        at org.apache.spark.rdd.RDD$$anonfun$collect$1.apply(RDD.scala:909)
        at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationSc=
ope.scala:147)
        at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationSc=
ope.scala:108)
        at org.apache.spark.rdd.RDD.withScope(RDD.scala:310)
        at org.apache.spark.rdd.RDD.collect(RDD.scala:908)
        at org.apache.spark.sql.execution.SparkPlan.executeCollect(SparkPla=
n.scala:177)
        at org.apache.spark.sql.hive.HiveContext$QueryExecution.stringResul=
t(HiveContext.scala:587)
        at org.apache.spark.sql.hive.thriftserver.SparkSQLDriver.run(SparkS=
QLDriver.scala:63)
        at org.apache.spark.sql.hive.thriftserver.SparkSQLCLIDriver.process=
Cmd(SparkSQLCLIDriver.scala:308)
        at org.apache.hadoop.hive.cli.CliDriver.processLine(CliDriver.java:=
376)
        at org.apache.spark.sql.hive.thriftserver.SparkSQLCLIDriver$.main(S=
parkSQLCLIDriver.scala:226)
        at org.apache.spark.sql.hive.thriftserver.SparkSQLCLIDriver.main(Sp=
arkSQLCLIDriver.scala)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessor=
Impl.java:57)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethod=
AccessorImpl.java:43)
        at java.lang.reflect.Method.invoke(Method.java:606)
        at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$Spa=
rkSubmit$$runMain(SparkSubmit.scala:674)
        at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.sca=
la:180)
        at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:20=
5)
        at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:120)
        at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)
Caused by: java.util.concurrent.ExecutionException: java.lang.NumberFormatE=
xception: For input string: "0000039_0000"
        at java.util.concurrent.FutureTask$Sync.innerGet(FutureTask.java:25=
2)
        at java.util.concurrent.FutureTask.get(FutureTask.java:111)
        at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat.generateSplitsIn=
fo(OrcInputFormat.java:998)
        ... 43 more
Caused by: java.lang.NumberFormatException: For input string: "0000039_0000=
"
        at java.lang.NumberFormatException.forInputString(NumberFormatExcep=
tion.java:65)
        at java.lang.Long.parseLong(Long.java:441)
        at java.lang.Long.parseLong(Long.java:483)
        at org.apache.hadoop.hive.ql.io.AcidUtils.parseDelta(AcidUtils.java=
:310)
        at org.apache.hadoop.hive.ql.io.AcidUtils.getAcidState(AcidUtils.ja=
va:379)
        at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat$FileGenerator.ca=
ll(OrcInputFormat.java:634)
        at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat$FileGenerator.ca=
ll(OrcInputFormat.java:620)
        at java.util.concurrent.FutureTask$Sync.innerRun(FutureTask.java:33=
4)
        at java.util.concurrent.FutureTask.run(FutureTask.java:166)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExec=
utor.java:1145)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExe=
cutor.java:615)
        at java.lang.Thread.run(Thread.java:724)
java.lang.RuntimeException: serious problem
        at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat.generateSplitsIn=
fo(OrcInputFormat.java:1021)
        at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat.getSplits(OrcInp=
utFormat.java:1048)
        at org.apache.spark.rdd.HadoopRDD.getPartitions(HadoopRDD.scala:207=
)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
39)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
37)
        at scala.Option.getOrElse(Option.scala:120)
        at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)
        at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartition=
sRDD.scala:35)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
39)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
37)
        at scala.Option.getOrElse(Option.scala:120)
        at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)
        at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartition=
sRDD.scala:35)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
39)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
37)
        at scala.Option.getOrElse(Option.scala:120)
        at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)
        at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartition=
sRDD.scala:35)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
39)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:2=
37)
        at scala.Option.getOrElse(Option.scala:120)
        at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)
        at org.apache.spark.SparkContext.runJob(SparkContext.scala:1921)
        at org.apache.spark.rdd.RDD$$anonfun$collect$1.apply(RDD.scala:909)
        at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationSc=
ope.scala:147)
        at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationSc=
ope.scala:108)
        at org.apache.spark.rdd.RDD.withScope(RDD.scala:310)
        at org.apache.spark.rdd.RDD.collect(RDD.scala:908)
        at org.apache.spark.sql.execution.SparkPlan.executeCollect(SparkPla=
n.scala:177)
        at org.apache.spark.sql.hive.HiveContext$QueryExecution.stringResul=
t(HiveContext.scala:587)
        at org.apache.spark.sql.hive.thriftserver.SparkSQLDriver.run(SparkS=
QLDriver.scala:63)
        at org.apache.spark.sql.hive.thriftserver.SparkSQLCLIDriver.process=
Cmd(SparkSQLCLIDriver.scala:308)
        at org.apache.hadoop.hive.cli.CliDriver.processLine(CliDriver.java:=
376)
        at org.apache.spark.sql.hive.thriftserver.SparkSQLCLIDriver$.main(S=
parkSQLCLIDriver.scala:226)
        at org.apache.spark.sql.hive.thriftserver.SparkSQLCLIDriver.main(Sp=
arkSQLCLIDriver.scala)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessor=
Impl.java:57)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethod=
AccessorImpl.java:43)
        at java.lang.reflect.Method.invoke(Method.java:606)
        at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$Spa=
rkSubmit$$runMain(SparkSubmit.scala:674)
        at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.sca=
la:180)
        at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:20=
5)
        at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:120)
        at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)
Caused by: java.util.concurrent.ExecutionException: java.lang.NumberFormatE=
xception: For input string: "0000039_0000"
        at java.util.concurrent.FutureTask$Sync.innerGet(FutureTask.java:25=
2)
        at java.util.concurrent.FutureTask.get(FutureTask.java:111)
        at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat.generateSplitsIn=
fo(OrcInputFormat.java:998)
        ... 43 more
Caused by: java.lang.NumberFormatException: For input string: "0000039_0000=
"
        at java.lang.NumberFormatException.forInputString(NumberFormatExcep=
tion.java:65)
        at java.lang.Long.parseLong(Long.java:441)
        at java.lang.Long.parseLong(Long.java:483)
        at org.apache.hadoop.hive.ql.io.AcidUtils.parseDelta(AcidUtils.java=
:310)
        at org.apache.hadoop.hive.ql.io.AcidUtils.getAcidState(AcidUtils.ja=
va:379)
        at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat$FileGenerator.ca=
ll(OrcInputFormat.java:634)
        at org.apache.hadoop.hive.ql.io.orc.OrcInputFormat$FileGenerator.ca=
ll(OrcInputFormat.java:620)
        at java.util.concurrent.FutureTask$Sync.innerRun(FutureTask.java:33=
4)
        at java.util.concurrent.FutureTask.run(FutureTask.java:166)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExec=
utor.java:1145)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExe=
cutor.java:615)
        at java.lang.Thread.run(Thread.java:724)


Dr Mich Talebzadeh


LinkedIn  https://www.linkedin.com/profile/view?id=3DAAEAAAAWh2gBxianrbJd6z=
P6AcPCCdOABUrV8Pw


http://talebzadehmich.wordpress.com<http://talebzadehmich.wordpress.com/>


--_000_D315815E4B51Aekoifmanhortonworkscom_
Content-Type: text/html; charset="Windows-1252"
Content-ID: <826B5979A99D534D96B2F3142CC24374@exch080.serverpod.net>
Content-Transfer-Encoding: quoted-printable

<html>
<head>
<meta http-equiv=3D"Content-Type" content=3D"text/html; charset=3DWindows-1=
252">
</head>
<body style=3D"word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-lin=
e-break: after-white-space; color: rgb(0, 0, 0); font-size: 14px; font-fami=
ly: Calibri, sans-serif;">
<div>The system thinks t2 is an Acid table but the files on disk don=92t fo=
llow the convention acid system would expect.</div>
<div>Perhaps Xuefu Zhang would know more on Spark/Aicd integration.</div>
<div><br>
</div>
<span id=3D"OLK_SRC_BODY_SECTION">
<div style=3D"font-family:Calibri; font-size:11pt; text-align:left; color:b=
lack; BORDER-BOTTOM: medium none; BORDER-LEFT: medium none; PADDING-BOTTOM:=
 0in; PADDING-LEFT: 0in; PADDING-RIGHT: 0in; BORDER-TOP: #b5c4df 1pt solid;=
 BORDER-RIGHT: medium none; PADDING-TOP: 3pt">
<span style=3D"font-weight:bold">From: </span>Mich Talebzadeh &lt;<a href=
=3D"mailto:mich.talebzadeh@gmail.com">mich.talebzadeh@gmail.com</a>&gt;<br>
<span style=3D"font-weight:bold">Reply-To: </span>&quot;<a href=3D"mailto:u=
ser@hive.apache.org">user@hive.apache.org</a>&quot; &lt;<a href=3D"mailto:u=
ser@hive.apache.org">user@hive.apache.org</a>&gt;<br>
<span style=3D"font-weight:bold">Date: </span>Monday, March 21, 2016 at 9:3=
9 AM<br>
<span style=3D"font-weight:bold">To: </span>&quot;user @spark&quot; &lt;<a =
href=3D"mailto:user@spark.apache.org">user@spark.apache.org</a>&gt;, user &=
lt;<a href=3D"mailto:user@hive.apache.org">user@hive.apache.org</a>&gt;<br>
<span style=3D"font-weight:bold">Subject: </span>Error selecting from a Hiv=
e ORC table in Spark-sql<br>
</div>
<div><br>
</div>
<div>
<div>
<div dir=3D"ltr">
<div>Hi,</div>
<div><br>
</div>
<div>Do we know the cause of this error when selecting from an Hive ORC tab=
le</div>
<div><br>
</div>
<div><font color=3D"#0000ff" face=3D"monospace,monospace">spark-sql&gt; <st=
rong>select * from t2;<br>
</strong>16/03/21 16:38:33 ERROR SparkSQLDriver: Failed in [select * from t=
2]<br>
java.lang.RuntimeException: serious problem<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.ql.io.=
orc.OrcInputFormat.generateSplitsInfo(OrcInputFormat.java:1021)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.ql.io.=
orc.OrcInputFormat.getSplits(OrcInputFormat.java:1048)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.HadoopRD=
D.getPartitions(HadoopRDD.scala:207)</font></div>
<div><font color=3D"#0000ff" face=3D"monospace,monospace">&nbsp;&nbsp;&nbsp=
;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$anonfun$partitions$2=
.apply(RDD.scala:239)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at scala.Option.getOrElse(Option=
.scala:120)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD.part=
itions(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.MapParti=
tionsRDD.getPartitions(MapPartitionsRDD.scala:35)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:239)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at scala.Option.getOrElse(Option=
.scala:120)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD.part=
itions(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.MapParti=
tionsRDD.getPartitions(MapPartitionsRDD.scala:35)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:239)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at scala.Option.getOrElse(Option=
.scala:120)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD.part=
itions(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.MapParti=
tionsRDD.getPartitions(MapPartitionsRDD.scala:35)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:239)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at scala.Option.getOrElse(Option=
.scala:120)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD.part=
itions(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.SparkContext=
.runJob(SparkContext.scala:1921)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$collect$1.apply(RDD.scala:909)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDDOpera=
tionScope$.withScope(RDDOperationScope.scala:147)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDDOpera=
tionScope$.withScope(RDDOperationScope.scala:108)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD.with=
Scope(RDD.scala:310)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD.coll=
ect(RDD.scala:908)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.sql.executio=
n.SparkPlan.executeCollect(SparkPlan.scala:177)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.sql.hive.Hiv=
eContext$QueryExecution.stringResult(HiveContext.scala:587)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.sql.hive.thr=
iftserver.SparkSQLDriver.run(SparkSQLDriver.scala:63)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.sql.hive.thr=
iftserver.SparkSQLCLIDriver.processCmd(SparkSQLCLIDriver.scala:308)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.cli.Cl=
iDriver.processLine(CliDriver.java:376)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.sql.hive.thr=
iftserver.SparkSQLCLIDriver$.main(SparkSQLCLIDriver.scala:226)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.sql.hive.thr=
iftserver.SparkSQLCLIDriver.main(SparkSQLCLIDriver.scala)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at sun.reflect.NativeMethodAcces=
sorImpl.invoke0(Native Method)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at sun.reflect.NativeMethodAcces=
sorImpl.invoke(NativeMethodAccessorImpl.java:57)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at sun.reflect.DelegatingMethodA=
ccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.lang.reflect.Method.invo=
ke(Method.java:606)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.deploy.Spark=
Submit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:674)=
<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.deploy.Spark=
Submit$.doRunMain$1(SparkSubmit.scala:180)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.deploy.Spark=
Submit$.submit(SparkSubmit.scala:205)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.deploy.Spark=
Submit$.main(SparkSubmit.scala:120)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.deploy.Spark=
Submit.main(SparkSubmit.scala)<br>
Caused by: java.util.concurrent.ExecutionException: java.lang.NumberFormatE=
xception: For input string: &quot;0000039_0000&quot;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.util.concurrent.FutureTa=
sk$Sync.innerGet(FutureTask.java:252)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.util.concurrent.FutureTa=
sk.get(FutureTask.java:111)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.ql.io.=
orc.OrcInputFormat.generateSplitsInfo(OrcInputFormat.java:998)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ... 43 more<br>
Caused by: java.lang.NumberFormatException: For input string: &quot;0000039=
_0000&quot;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.lang.NumberFormatExcepti=
on.forInputString(NumberFormatException.java:65)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.lang.Long.parseLong(Long=
.java:441)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.lang.Long.parseLong(Long=
.java:483)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.ql.io.=
AcidUtils.parseDelta(AcidUtils.java:310)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.ql.io.=
AcidUtils.getAcidState(AcidUtils.java:379)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.ql.io.=
orc.OrcInputFormat$FileGenerator.call(OrcInputFormat.java:634)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.ql.io.=
orc.OrcInputFormat$FileGenerator.call(OrcInputFormat.java:620)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.util.concurrent.FutureTa=
sk$Sync.innerRun(FutureTask.java:334)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.util.concurrent.FutureTa=
sk.run(FutureTask.java:166)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.util.concurrent.ThreadPo=
olExecutor.runWorker(ThreadPoolExecutor.java:1145)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.util.concurrent.ThreadPo=
olExecutor$Worker.run(ThreadPoolExecutor.java:615)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.lang.Thread.run(Thread.j=
ava:724)<br>
java.lang.RuntimeException: serious problem<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.ql.io.=
orc.OrcInputFormat.generateSplitsInfo(OrcInputFormat.java:1021)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.ql.io.=
orc.OrcInputFormat.getSplits(OrcInputFormat.java:1048)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.HadoopRD=
D.getPartitions(HadoopRDD.scala:207)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:239)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at scala.Option.getOrElse(Option=
.scala:120)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD.part=
itions(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.MapParti=
tionsRDD.getPartitions(MapPartitionsRDD.scala:35)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:239)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at scala.Option.getOrElse(Option=
.scala:120)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD.part=
itions(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.MapParti=
tionsRDD.getPartitions(MapPartitionsRDD.scala:35)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:239)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at scala.Option.getOrElse(Option=
.scala:120)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD.part=
itions(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.MapParti=
tionsRDD.getPartitions(MapPartitionsRDD.scala:35)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:239)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$partitions$2.apply(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at scala.Option.getOrElse(Option=
.scala:120)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD.part=
itions(RDD.scala:237)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.SparkContext=
.runJob(SparkContext.scala:1921)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD$$ano=
nfun$collect$1.apply(RDD.scala:909)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDDOpera=
tionScope$.withScope(RDDOperationScope.scala:147)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDDOpera=
tionScope$.withScope(RDDOperationScope.scala:108)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD.with=
Scope(RDD.scala:310)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.rdd.RDD.coll=
ect(RDD.scala:908)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.sql.executio=
n.SparkPlan.executeCollect(SparkPlan.scala:177)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.sql.hive.Hiv=
eContext$QueryExecution.stringResult(HiveContext.scala:587)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.sql.hive.thr=
iftserver.SparkSQLDriver.run(SparkSQLDriver.scala:63)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.sql.hive.thr=
iftserver.SparkSQLCLIDriver.processCmd(SparkSQLCLIDriver.scala:308)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.cli.Cl=
iDriver.processLine(CliDriver.java:376)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.sql.hive.thr=
iftserver.SparkSQLCLIDriver$.main(SparkSQLCLIDriver.scala:226)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.sql.hive.thr=
iftserver.SparkSQLCLIDriver.main(SparkSQLCLIDriver.scala)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at sun.reflect.NativeMethodAcces=
sorImpl.invoke0(Native Method)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at sun.reflect.NativeMethodAcces=
sorImpl.invoke(NativeMethodAccessorImpl.java:57)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at sun.reflect.DelegatingMethodA=
ccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.lang.reflect.Method.invo=
ke(Method.java:606)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.deploy.Spark=
Submit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:674)=
<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.deploy.Spark=
Submit$.doRunMain$1(SparkSubmit.scala:180)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.deploy.Spark=
Submit$.submit(SparkSubmit.scala:205)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.deploy.Spark=
Submit$.main(SparkSubmit.scala:120)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.spark.deploy.Spark=
Submit.main(SparkSubmit.scala)<br>
Caused by: java.util.concurrent.ExecutionException: java.lang.NumberFormatE=
xception: For input string: &quot;0000039_0000&quot;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.util.concurrent.FutureTa=
sk$Sync.innerGet(FutureTask.java:252)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.util.concurrent.FutureTa=
sk.get(FutureTask.java:111)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.ql.io.=
orc.OrcInputFormat.generateSplitsInfo(OrcInputFormat.java:998)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ... 43 more<br>
Caused by: java.lang.NumberFormatException: For input string: &quot;0000039=
_0000&quot;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.lang.NumberFormatExcepti=
on.forInputString(NumberFormatException.java:65)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.lang.Long.parseLong(Long=
.java:441)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.lang.Long.parseLong(Long=
.java:483)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.ql.io.=
AcidUtils.parseDelta(AcidUtils.java:310)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.ql.io.=
AcidUtils.getAcidState(AcidUtils.java:379)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.ql.io.=
orc.OrcInputFormat$FileGenerator.call(OrcInputFormat.java:634)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.apache.hadoop.hive.ql.io.=
orc.OrcInputFormat$FileGenerator.call(OrcInputFormat.java:620)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.util.concurrent.FutureTa=
sk$Sync.innerRun(FutureTask.java:334)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.util.concurrent.FutureTa=
sk.run(FutureTask.java:166)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.util.concurrent.ThreadPo=
olExecutor.runWorker(ThreadPoolExecutor.java:1145)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.util.concurrent.ThreadPo=
olExecutor$Worker.run(ThreadPoolExecutor.java:615)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.lang.Thread.run(Thread.j=
ava:724)<br>
<br>
</font></div>
<div><br>
</div>
<div><br clear=3D"all">
</div>
<div>
<div class=3D"gmail_signature">
<div dir=3D"ltr"><font color=3D"#000000" face=3D"Times New Roman" size=3D"3=
"></font>
<p style=3D"margin:0cm 0cm 0pt"><font color=3D"#000000" face=3D"Calibri" si=
ze=3D"3">Dr Mich Talebzadeh</font></p>
<font color=3D"#000000" face=3D"Times New Roman" size=3D"3"></font>
<p style=3D"margin:0cm 0cm 0pt"><font color=3D"#000000" face=3D"Calibri" si=
ze=3D"3">&nbsp;</font></p>
<font color=3D"#000000" face=3D"Times New Roman" size=3D"3"></font>
<p style=3D"margin:0cm 0cm 0pt"><span style=3D"font-family: Arial, sans-ser=
if;"><font color=3D"#000000" size=3D"3">LinkedIn
</font></span><i><span style=3D"font-family: Arial, sans-serif; font-size: =
10pt;"><font color=3D"#000000">&nbsp;</font><a href=3D"https://www.linkedin=
.com/profile/view?id=3DAAEAAAAWh2gBxianrbJd6zP6AcPCCdOABUrV8Pw" target=3D"_=
blank"><font color=3D"#0000ff">https://www.linkedin.com/profile/view?id=3DA=
AEAAAAWh2gBxianrbJd6zP6AcPCCdOABUrV8Pw</font></a></span></i></p>
<font color=3D"#000000" face=3D"Times New Roman" size=3D"3"></font>
<p style=3D"margin:0cm 0cm 0pt"><font color=3D"#000000" face=3D"Calibri" si=
ze=3D"3">&nbsp;</font></p>
<font color=3D"#000000" face=3D"Times New Roman" size=3D"3"></font>
<p style=3D"margin:0cm 0cm 0pt;text-align:justify"><span style=3D"font-fami=
ly: Arial, sans-serif; font-size: 10pt;"><a href=3D"http://talebzadehmich.w=
ordpress.com/" target=3D"_blank"><font color=3D"#0000ff">http://talebzadehm=
ich.wordpress.com</font></a></span></p>
<font color=3D"#000000" face=3D"Times New Roman" size=3D"3"></font>
<p style=3D"margin:0cm 0cm 0pt"><span style=3D"font-family: Arial, sans-ser=
if; font-size: 9pt;"><font color=3D"#000000">&nbsp;</font></span></p>
<font color=3D"#000000" face=3D"Times New Roman" size=3D"3"></font></div>
</div>
</div>
</div>
</div>
</div>
</span>
</body>
</html>

--_000_D315815E4B51Aekoifmanhortonworkscom_--