kylin-user mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From 163 <amus...@163.com>
Subject Re: 关于Kylin使用上的一些问题
Date Wed, 07 Oct 2015 07:57:53 GMT
Hi Luke

Thanks for you quick reply and happy holiday.

你说的只要一张事实表,我不是太理解,如果我有时间(小时,天,月)与空间

(省、市)两个维度,这张事实表的结构应该是怎么样的?是不是也有两个
维度 
字段,类型是Integer,叫“时间”与“空间”,把不同的时间用不同的编码表示,如

小时可以表示成1,天可以表示成2,月可以表示成3, 空间也是一样。

这里的效率主要想了解一下Kylin生成Cube的效率,而对于Query latency主要还是

基于HBase的精确查询和简单的统计,一般都是比较快的。

谢谢

在 2015/9/29 23:52, Luke Han 写道:
> Hi there,
>     You case should be fine,which is typical OLAP scenario.
>     Please try to generate Star-Schema in Hive: one fact table and 
> some Lookup Tables (you do not need create 18 fact tables;-), and 
> create cube based on this data model, remember to leverage hierarchy 
> and derived dimension as much as possible to avoid huge cube to be 
> generated.
>
>      For performance, are you asking for cube processing or query latency?
>
>     Any issue, please feel free to ask here.
>     Thanks.
> Luke
>
>
> Best Regards!
> ---------------------
>
> Luke Han
>
> 2015-09-29 23:10 GMT+08:00 163 <amuseme@163.com <mailto:amuseme@163.com>>:
>
>     Hi all
>
>     有一些关于Kylin使用上的问题想请教一下,我们现在有这样一些维度,不
>     知道用 Kylin能不能实现,或者要做什么调整来实现,在效率上会不会
有
>     问题。
>
>     目前我们主要有时间(小时,日,月)、空间(省,市)、业务(一级业
>     务,二级 业务)、终端(用户终端品牌,型号)、用户维度(用户号
>     码)。其中用 户维度 的数据量比较大。
>
>     现在我想用Kylin来做OLAP,是不是要生成3x2x2x2x1=18张事实表,这样就
>     需要在 Kylin在建立18个Cube。目前一天输入 的数据量在20TB左右,记录
>     数在5千万条。 不知道Kylin的处理效率怎么样?
>
>     谢谢
>
>


Mime
View raw message