doris-commits mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From GitBox <...@apache.org>
Subject [GitHub] [incubator-doris] wenbronk opened a new issue #2806: wrong sequence of 1.2 and 1.4
Date Mon, 20 Jan 2020 01:58:33 GMT
wenbronk opened a new issue #2806: wrong sequence of 1.2 and 1.4
URL: https://github.com/apache/incubator-doris/issues/2806
 
 
   http://doris.apache.org/documentation/cn/getting-started/best-practice.html#star-schema
   
   ![image](http://images.wenbronk.cn/markdown201912/20200120095515.png)
   
   ```
   1.2 大宽表与 Star Schema
   
   业务方建表时, 为了和前端业务适配, 往往不对维度信息和指标信息加以区分,
而将 Schema 定义成大宽表。对于 Doris 而言, 这类大宽表往往性能不尽如人意:
   
   Schema 中字段数比较多, 聚合模型中可能 key 列比较多, 导入过程中需要排序的列会增加。
   维度信息更新会反应到整张表中,而更新的频率直接影响查询的效率。
   使用过程中,建议用户尽量使用 Star Schema 区分维度表和指标表。频繁更新的维度表也可以放在
MySQL 外部表中。而如果只有少量更新, 可以直接放在 Doris 中。在 Doris
中存储维度表时,可对维度表设置更多的副本,提升 Join 的性能。
   
   1.4 分区和分桶
   
   Doris 支持两级分区存储, 第一层为 RANGE 分区(partition), 第二层为 HASH
分桶(bucket)。
   
   RANGE分区(partition)
   
   RANGE分区用于将数据划分成不同区间, 逻辑上可以理解为将原始表划分成了
   ```

----------------------------------------------------------------
This is an automated message from the Apache Git Service.
To respond to the message, please log on to GitHub and use the
URL above to go to the specific comment.
 
For queries about this service, please contact Infrastructure at:
users@infra.apache.org


With regards,
Apache Git Services

---------------------------------------------------------------------
To unsubscribe, e-mail: commits-unsubscribe@doris.apache.org
For additional commands, e-mail: commits-help@doris.apache.org


Mime
View raw message