Mailing-List: contact user-help@cassandra.apache.org; run by ezmlm
Precedence: bulk
Reply-To: user@cassandra.apache.org
Received-SPF: pass (athena.apache.org: domain of mohammed@glassbeam.com
 designates 64.95.72.252 as permitted sender)
From: Mohammed Guller <mohammed@glassbeam.com>
To: "user@cassandra.apache.org" <user@cassandra.apache.org>
Subject: Cassandra terminates with OutOfMemory (OOM) error
Thread-Topic: Cassandra terminates with OutOfMemory (OOM) error
Thread-Index: Ac5upoKpXLf4ZhFYSeCoo+LA5eivUQ==
Date: Fri, 21 Jun 2013 17:49:14 +0000
Message-ID: <045D8FD556C73347A47F956EE65F82200360A5B7@S11MAILD002N1.sh11.lan>
Accept-Language: en-US
Content-Language: en-US
Content-Type: multipart/alternative;
	boundary="_000_045D8FD556C73347A47F956EE65F82200360A5B7S11MAILD002N1sh_"
MIME-Version: 1.0

--_000_045D8FD556C73347A47F956EE65F82200360A5B7S11MAILD002N1sh_
Content-Type: text/plain; charset="us-ascii"
Content-Transfer-Encoding: quoted-printable

We have a 3-node cassandra cluster on AWS. These nodes are running cassandr=
a 1.2.2 and have 8GB memory. We didn't change any of the default heap or GC=
 settings. So each node is allocating 1.8GB of heap space. The rows are wid=
e; each row stores around 260,000 columns. We are reading the data using As=
tyanax. If our application tries to read 80,000 columns each from 10 or mor=
e rows at the same time, some of the nodes run out of heap space and termin=
ate with OOM error. Here is the error message:

java.lang.OutOfMemoryError: Java heap space
        at java.nio.HeapByteBuffer.duplicate(HeapByteBuffer.java:107)
        at org.apache.cassandra.db.marshal.AbstractCompositeType.getBytes(A=
bstractCompositeType.java:50)
        at org.apache.cassandra.db.marshal.AbstractCompositeType.getWithSho=
rtLength(AbstractCompositeType.java:60)
        at org.apache.cassandra.db.marshal.AbstractCompositeType.split(Abst=
ractCompositeType.java:126)
        at org.apache.cassandra.db.filter.ColumnCounter$GroupByPrefix.count=
(ColumnCounter.java:96)
        at org.apache.cassandra.db.filter.SliceQueryFilter.collectReducedCo=
lumns(SliceQueryFilter.java:164)
        at org.apache.cassandra.db.filter.QueryFilter.collateColumns(QueryF=
ilter.java:136)
        at org.apache.cassandra.db.filter.QueryFilter.collateOnDiskAtom(Que=
ryFilter.java:84)
        at org.apache.cassandra.db.CollationController.collectAllData(Colla=
tionController.java:294)
        at org.apache.cassandra.db.CollationController.getTopLevelColumns(C=
ollationController.java:65)
        at org.apache.cassandra.db.ColumnFamilyStore.getTopLevelColumns(Col=
umnFamilyStore.java:1363)
        at org.apache.cassandra.db.ColumnFamilyStore.getColumnFamily(Column=
FamilyStore.java:1220)
        at org.apache.cassandra.db.ColumnFamilyStore.getColumnFamily(Column=
FamilyStore.java:1132)
        at org.apache.cassandra.db.Table.getRow(Table.java:355)
        at org.apache.cassandra.db.SliceFromReadCommand.getRow(SliceFromRea=
dCommand.java:70)
       at org.apache.cassandra.service.StorageProxy$LocalReadRunnable.runMa=
yThrow(StorageProxy.java:1052)
        at org.apache.cassandra.service.StorageProxy$DroppableRunnable.run(=
StorageProxy.java:1578)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExec=
utor.java:1110)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExe=
cutor.java:603)
        at java.lang.Thread.run(Thread.java:722)

ERROR 02:14:05,351 Exception in thread Thread[Thrift:6,5,main]
java.lang.OutOfMemoryError: Java heap space
        at java.lang.Long.toString(Long.java:269)
        at java.lang.Long.toString(Long.java:764)
        at org.apache.cassandra.dht.Murmur3Partitioner$1.toString(Murmur3Pa=
rtitioner.java:171)
        at org.apache.cassandra.service.StorageService.describeRing(Storage=
Service.java:1068)
        at org.apache.cassandra.thrift.CassandraServer.describe_ring(Cassan=
draServer.java:1192)
        at org.apache.cassandra.thrift.Cassandra$Processor$describe_ring.ge=
tResult(Cassandra.java:3766)
        at org.apache.cassandra.thrift.Cassandra$Processor$describe_ring.ge=
tResult(Cassandra.java:3754)
        at org.apache.thrift.ProcessFunction.process(ProcessFunction.java:3=
2)
        at org.apache.thrift.TBaseProcessor.process(TBaseProcessor.java:34)
        at org.apache.cassandra.thrift.CustomTThreadPoolServer$WorkerProces=
s.run(CustomTThreadPoolServer.java:199)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExec=
utor.java:1110)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExe=
cutor.java:603)
        at java.lang.Thread.run(Thread.java:722)

The data in each column is less than 50 bytes. After adding all the column =
overheads (column name + metadata), it should not be more than 100 bytes. S=
o reading 80,000 columns from 10 rows each means that we are reading 80,000=
 * 10 * 100 =3D 80 MB of data. It is large, but not large enough to fill up=
 the 1.8 GB heap. So I wonder why the heap is getting full. If the data req=
uest is too big to fill in a reasonable amount of time, I would expect Cass=
andra to return a TimeOutException instead of terminating.

One easy solution is to increase the heapsize. However that means Cassandra=
 can still crash if someone reads 100 rows.  I wonder if there some other C=
assandra setting that I can tweak to prevent the OOM exception?

Thanks,
Mohammed

--_000_045D8FD556C73347A47F956EE65F82200360A5B7S11MAILD002N1sh_
Content-Type: text/html; charset="us-ascii"
Content-Transfer-Encoding: quoted-printable

<html xmlns:v=3D"urn:schemas-microsoft-com:vml" xmlns:o=3D"urn:schemas-micr=
osoft-com:office:office" xmlns:w=3D"urn:schemas-microsoft-com:office:word" =
xmlns:dt=3D"uuid:C2F41010-65B3-11d1-A29F-00AA00C14882" xmlns:m=3D"http://sc=
hemas.microsoft.com/office/2004/12/omml" xmlns=3D"http://www.w3.org/TR/REC-=
html40">
<head>
<meta http-equiv=3D"Content-Type" content=3D"text/html; charset=3Dus-ascii"=
>
<meta name=3D"Generator" content=3D"Microsoft Word 14 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
	{font-family:Calibri;
	panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
	{margin:0in;
	margin-bottom:.0001pt;
	font-size:11.0pt;
	font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
	{mso-style-priority:99;
	color:blue;
	text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
	{mso-style-priority:99;
	color:purple;
	text-decoration:underline;}
p
	{mso-style-priority:99;
	mso-margin-top-alt:auto;
	margin-right:0in;
	margin-bottom:12.0pt;
	margin-left:0in;
	font-size:12.0pt;
	font-family:"Times New Roman","serif";}
span.EmailStyle17
	{mso-style-type:personal-compose;
	font-family:"Calibri","sans-serif";
	color:windowtext;}
.MsoChpDefault
	{mso-style-type:export-only;
	font-family:"Calibri","sans-serif";}
@page WordSection1
	{size:8.5in 11.0in;
	margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
	{page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext=3D"edit" spidmax=3D"1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext=3D"edit">
<o:idmap v:ext=3D"edit" data=3D"1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang=3D"EN-US" link=3D"blue" vlink=3D"purple">
<div class=3D"WordSection1">
<p class=3D"MsoNormal">We have a 3-node cassandra cluster on AWS. These nod=
es are running cassandra 1.2.2 and have 8GB memory. We didn't change any of=
 the default heap or GC settings. So each node is allocating 1.8GB of heap =
space. The rows are wide; each row
 stores around 260,000 columns. We are reading the data using Astyanax. If =
our application tries to read 80,000 columns each from 10 or more rows at t=
he same time, some of the nodes run out of heap space and terminate with OO=
M error. Here is the error message:<o:p></o:p></p>
<p class=3D"MsoNormal"><o:p>&nbsp;</o:p></p>
<p class=3D"MsoNormal">java.lang.OutOfMemoryError: Java heap space<o:p></o:=
p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.n=
io.HeapByteBuffer.duplicate(HeapByteBuffer.java:107)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.db.marshal.AbstractCompositeType.getBytes(AbstractCompositeT=
ype.java:50)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.db.marshal.AbstractCompositeType.getWithShortLength(Abstract=
CompositeType.java:60)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.db.marshal.AbstractCompositeType.split(AbstractCompositeType=
.java:126)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.db.filter.ColumnCounter$GroupByPrefix.count(ColumnCounter.ja=
va:96)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.db.filter.SliceQueryFilter.collectReducedColumns(SliceQueryF=
ilter.java:164)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.db.filter.QueryFilter.collateColumns(QueryFilter.java:136)<o=
:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.db.filter.QueryFilter.collateOnDiskAtom(QueryFilter.java:84)=
<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.db.CollationController.collectAllData(CollationController.ja=
va:294)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.db.CollationController.getTopLevelColumns(CollationControlle=
r.java:65)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.db.ColumnFamilyStore.getTopLevelColumns(ColumnFamilyStore.ja=
va:1363)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.db.ColumnFamilyStore.getColumnFamily(ColumnFamilyStore.java:=
1220)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.db.ColumnFamilyStore.getColumnFamily(ColumnFamilyStore.java:=
1132)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.db.Table.getRow(Table.java:355)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.db.SliceFromReadCommand.getRow(SliceFromReadCommand.java:70)=
<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;at org.apa=
che.cassandra.service.StorageProxy$LocalReadRunnable.runMayThrow(StoragePro=
xy.java:1052)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.service.StorageProxy$DroppableRunnable.run(StorageProxy.java=
:1578)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.u=
til.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1110)<o=
:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.u=
til.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:603)<o=
:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.l=
ang.Thread.run(Thread.java:722)<o:p></o:p></p>
<p class=3D"MsoNormal"><o:p>&nbsp;</o:p></p>
<p class=3D"MsoNormal">ERROR 02:14:05,351 Exception in thread Thread[Thrift=
:6,5,main]<o:p></o:p></p>
<p class=3D"MsoNormal">java.lang.OutOfMemoryError: Java heap space<o:p></o:=
p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.l=
ang.Long.toString(Long.java:269)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.l=
ang.Long.toString(Long.java:764)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.dht.Murmur3Partitioner$1.toString(Murmur3Partitioner.java:17=
1)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.service.StorageService.describeRing(StorageService.java:1068=
)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.thrift.CassandraServer.describe_ring(CassandraServer.java:11=
92)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.thrift.Cassandra$Processor$describe_ring.getResult(Cassandra=
.java:3766)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.thrift.Cassandra$Processor$describe_ring.getResult(Cassandra=
.java:3754)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.thrift.ProcessFunction.process(ProcessFunction.java:32)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.thrift.TBaseProcessor.process(TBaseProcessor.java:34)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at org.ap=
ache.cassandra.thrift.CustomTThreadPoolServer$WorkerProcess.run(CustomTThre=
adPoolServer.java:199)<o:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.u=
til.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1110)<o=
:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.u=
til.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:603)<o=
:p></o:p></p>
<p class=3D"MsoNormal">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; at java.l=
ang.Thread.run(Thread.java:722)<o:p></o:p></p>
<p class=3D"MsoNormal"><o:p>&nbsp;</o:p></p>
<p class=3D"MsoNormal">The data in each column is less than 50 bytes. After=
 adding all the column overheads (column name &#43; metadata), it should no=
t be more than 100 bytes. So reading 80,000 columns from 10 rows each means=
 that we are reading 80,000 * 10 * 100
 =3D 80 MB of data. It is large, but not large enough to fill up the 1.8 GB=
 heap. So I wonder why the heap is getting full. If the data request is too=
 big to fill in a reasonable amount of time, I would expect Cassandra to re=
turn a TimeOutException instead of
 terminating. <o:p></o:p></p>
<p class=3D"MsoNormal"><o:p>&nbsp;</o:p></p>
<p class=3D"MsoNormal">One easy solution is to increase the heapsize. Howev=
er that means Cassandra can still crash if someone reads 100 rows. &nbsp;I =
wonder if there some other Cassandra setting that I can tweak to prevent th=
e OOM exception?<o:p></o:p></p>
<p class=3D"MsoNormal"><o:p>&nbsp;</o:p></p>
<p class=3D"MsoNormal">Thanks,<o:p></o:p></p>
<p class=3D"MsoNormal">Mohammed<o:p></o:p></p>
</div>
</body>
</html>

--_000_045D8FD556C73347A47F956EE65F82200360A5B7S11MAILD002N1sh_--