有不少没涉及过数仓的同学问我一些比较基础的问题,为了更好的理解前面讲到的一些理论,写一个小小的demo体会一下~~我们要构建一个订单主题,构建订...
缓慢变化维的提出是因为维度的属性并不是静态的,他会随着时间线延长发生缓慢的变化。常用的三种处理方式: 1.重写维度值,不保留历史,始终取最新数据...
1.hive sql >> 五星 在大多数的工作中,主要用的语言就是sql,说难不难,只要做的多了,基本就可以融会贯通,当然也要了解 hiv...
1.事实表模型设计 事实表有三种类型 : 事务事实表、周期快照事实表和累积快照事实表。事务事实表用来描述业务过程,眼踪空间或时间上某点的度量事件...
数仓规范,看似是无关紧要,实则是数仓实施最重要要素,也是衡量数仓标准的重要条件,有了规范,才能尽可能避免一些坑。 1.模型分层数仓入门基础-5-...
个人博客:https://renwula.github.io/,本系列基于互联网公司数仓,使用hive搭建数仓 从业中,数仓建模是一个数仓...
星型模型与雪花模型,应该是数仓面试者最喜欢提的问题,也是比较容易理解的概念。 1.星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事...
事实表,发生在现实世界中操作型时间,其产生的可度量数值,存储在事实表中,例如交易订单表。一般有以下几种事实特性: 1.可加、半可加、不可加事实 ...
三范式(3NF): 第一范式[https://baike.baidu.com/item/%E7%AC%AC%E4%B8%80%E8%8C%83...
文集作者