4篇文章 · 1836字 · 1人关注
为什么做增量数据量大,只需要增量最新被更改的数据。 如何做增量(1)insert into比如行为数据,发生一条记录就插入一条,数据不会被upd...
为什么分桶 (1)获得更高的查询处理效率。桶为表加上了额外的结构,Hive在处理有些查询时能利用这个结构。具体而言,连接两个在(包含连接列的)相...
为什么做分区 分区表将数据组织成分区,主要可以提高数据的查询速度。 如果把一年或者一个月的日志文件存放在一个表下,那么数据量会非常的大,当查询这...
业务分析人员或者管理者,经常会要看某个特定时间点的数据,所以需要对某些表做快照。 快照主要分为周期快照事实表和累积快照事实表。 周期快照事实表以...
文集作者