一. 数据模型架构原则 1.1 数据仓库分层 分层的好处: 清晰数据结构; 数据血缘追踪; 减少重复开发; 数据关系条理化; 屏蔽原始数据的影响。 当前DW结构现况 1.1....
一. 数据模型架构原则 1.1 数据仓库分层 分层的好处: 清晰数据结构; 数据血缘追踪; 减少重复开发; 数据关系条理化; 屏蔽原始数据的影响。 当前DW结构现况 1.1....
一. 大数据概览 什么是大数据 ?所谓的 “大” 实际上并不是大数据的最有趣的特征 。大数据是结构化、 半结构化、非结构化以及众多不同格式的原始数据 ,某些情况下 ,它看...
一. ETL 过程概览 本章将按照 ETL 系统规划与实现的流程组织讨论 。其中隐含地讨论上一章所讨论的 34 个 ETL 子系统 ,大致按照获取数据 、清洗与一致性、用...
一. 建模过程概述 开始讨论维度建模设计工作前,必须考虑正确的人选 。最值得注意的是,我们强烈主张业务代表参加建模会议 。他们的加入与合作必然会增加最终模型解决用户需求...
一. 生命周期初始活动 1.1 程序/项目规划与管理 毫无疑问,DW/BI 始于一系列的程序和项目规划活动 。 1.1.1 评估准备 在开始 DW/Bl工作前 ,有必要花...
一. 维度表技术基础 1.1 维度表结构 每个维度表都包含单一的主键列 。维度表的主键可以作为与之关联的任何事实表的外键,维度表行的描述环境应与事实表行完全对应 。维度表...
一. 事实表介绍 1.1 事实表结构 发生在现实世界中的操作型事件,所产生的可度量数值 ,存储在事实表中。从最低 的粒度级别来看 ,事实表行对应一个度量事件 ,反之亦然 ...
一.建模理论 1.1 ER实体模型 在信息系统中,将事务抽象为“实体”(Entity)、“属性”(Property)、“关系”(Relationship)来表示数据关联和事物...
一. 数据仓库定义 数据仓库(Data Warehouse,简称DW)是面向主题的、集成的、稳定的、反映历史变化的数据集合。 面向主题主题是业务数据特点的一种抽象表达,一般从...