kylin-user mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From 仇同心 <qiutong...@jd.com>
Subject 答复: 回复:DISTINCT_COUNT精确计算问题
Date Tue, 21 Jun 2016 07:27:21 GMT
您好:
Hash值是否会出现重复呢?

谢谢!

发件人: Weatherpop [mailto:623891205@qq.com]
发送时间: 2016年6月21日 15:11
收件人: user@kylin.apache.org; dev@kylin.apache.org
主题: 回复:DISTINCT_COUNT精确计算问题

可以自己做一张映射表,把值hash成int后就可以用精确的count distinct了
我们这边目前实践暂时是这样的

------------------ 原始邮件 ------------------
发件人: "仇同心";<qiutongxin@jd.com<mailto:qiutongxin@jd.com>>;
发送时间: 2016年6月21日(星期二) 下午3:08
收件人: "user@kylin.apache.org<mailto:user@kylin.apache.org>"<user@kylin.apache.org<mailto:user@kylin.apache.org>>;
"dev@kylin.apache.org<mailto:dev@kylin.apache.org>"<dev@kylin.apache.org<mailto:dev@kylin.apache.org>>;
主题: DISTINCT_COUNT精确计算问题

大家好:
     Hive字段类型为varchar,字段内容也包含英文字母和中文,对这样的字段能否做DISTINCT_COUNT精确计算?如果不能,有什么好的建议吗?

谢谢!
Mime
View raw message