kylin-dev mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From "May Zhou" <may.a.z...@foxmail.com>
Subject 回复: 大神,求助kylin的使用问题
Date Thu, 15 Nov 2018 12:40:01 GMT
Hi, have you try the parameter `kylin.query.enable-dynamic-column=true` which can count the
column without  NULL values.


BRs,
May


------------------ 原始邮件 ------------------
发件人: "George Ni"<nce111@alumni.sjtu.edu.cn>;
发送时间: 2018年11月15日(星期四) 晚上6:10
收件人: "dev"<dev@kylin.apache.org>;

主题: Re: 大神,求助kylin的使用问题



Hi, have you queried with "select count(*) from {fact_table}" both in hive and kylin, and
please check they have the same result. 

I doubt the segments you have built do not include all your hive data.

Best regards,
 
Chun’en Ni(George)

----- 原始邮件 -----
发件人: 742093703@qq.com
收件人: dev <dev@kylin.apache.org>
已发送邮件: Thu, 15 Nov 2018 17:43:31 +0800 (CST)
主题: 大神,求助kylin的使用问题

大神们好!

请容我慢慢描述我的问题
在kylin使用中,我建立了一个model,暂且叫他 big_int_sum_model,Dimensions有11个,
Measures 有三个 分别是 求count, SUM, SUM,  sum 是对 两个bigint字段求和,分别为
sum_4g 和sum_wifi ,用以统计4g总流量和wifi总流量
hive表中的数据有400万,在cube之后,可以从kylin查出数据。
但是出现了一个奇怪的现象:
    从 hive表中统计的4g流量总数为 295763957458 ,但是kylin中统计出来的是89605527250,
        hive表中统计的WIFI流量总数为 456897813426,但是kylin中统计出来的是164840037298。

各位大神,可以给点思考方向吗?




742093703@qq.com
Mime
  • Unnamed multipart/alternative (inline, 8-Bit, 0 bytes)
View raw message