Avatar notebook default
10篇文章 · 10312字 · 7人关注
  • Resize,w 360,h 240
    数仓基础入门-10-实践篇

    有不少没涉及过数仓的同学问我一些比较基础的问题,为了更好的理解前面讲到的一些理论,写一个小小的demo体会一下~~我们要构建一个订单主题,构建订...

  • 数仓入门基础-9-缓慢变化维

    缓慢变化维的提出是因为维度的属性并不是静态的,他会随着时间线延长发生缓慢的变化。常用的三种处理方式: 1.重写维度值,不保留历史,始终取最新数据...

  • 数仓入门基础-2-技术栈

    1.hive sql >> 五星 在大多数的工作中,主要用的语言就是sql,说难不难,只要做的多了,基本就可以融会贯通,当然也要了解 hiv...

  • Resize,w 360,h 240
    数仓入门基础-8-模型设计

    1.事实表模型设计 事实表有三种类型 : 事务事实表、周期快照事实表和累积快照事实表。事务事实表用来描述业务过程,眼踪空间或时间上某点的度量事件...

  • 数仓入门基础-7-数仓规范

    数仓规范,看似是无关紧要,实则是数仓实施最重要要素,也是衡量数仓标准的重要条件,有了规范,才能尽可能避免一些坑。 1.模型分层数仓入门基础-5-...

  • Resize,w 360,h 240
    数仓入门基础-6-数仓建模

    个人博客:https://renwula.github.io/,本系列基于互联网公司数仓,使用hive搭建数仓 从业中,数仓建模是一个数仓...

    1.8 3283 0 13
  • Resize,w 360,h 240
    数仓入门基础-5-雪花模型与星型模型

    星型模型与雪花模型,应该是数仓面试者最喜欢提的问题,也是比较容易理解的概念。 1.星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事...

  • 数仓入门基础-4-事实表与维度表

    事实表,发生在现实世界中操作型时间,其产生的可度量数值,存储在事实表中,例如交易订单表。一般有以下几种事实特性: 1.可加、半可加、不可加事实 ...

  • Resize,w 360,h 240
    数仓入门基础-3-数仓方法论

    三范式(3NF): 第一范式[https://baike.baidu.com/item/%E7%AC%AC%E4%B8%80%E8%8C%83...

文集作者