标准的数据仓库系统一般包含四层:ETL层、数据仓库层、数据集市层、应用展现层。
数据其实本质上就是一种虚拟商品。数据仓库系统实现的就是将虚拟的商品(数据)从原材料到成品售卖的过程。
ETL:抽取、转换、加载。对应的就是:采购原材料》》精选原材料》》确认原材料。
数据仓库:从字面意义上看, “仓库”可以想像成一所大房子,高高的货架,合理的出入路线,是一种集中存储货物的地方,一般顾客是不来参观访问的。这里,商品会根据不同的种类存在在不同的货架中。就好比,在数据仓库层,需要做的往往是把同类型的数据存放在同一张大宽表中(比如商品进销存,采购一张宽表,销售一张宽表,库存一张宽表等)
数据集市:说到“集市”,就容易联想到空旷的场地,川流不息,大小商户摆出摊子,卖衣物的、卖烧饼及卖艺的,是让顾客来消费的地方。这里,商品会被包装成不同的样子,也可以组合不同的组合,实现种类的多样化,往往这种组合就是有一定的关联性,就是为了吸引顾客来消费。就好比,在数据集市层,需要做的往往是结合实际业务多方位的需求,将多个需求进行整理,制作适用于多个需求的大宽表(比如商品销售和采购,商品销售和库存,商品采购和库存等)
数据仓库和数据集市本质上并没有什么不同。具体来说,数据仓库仅仅是提供存储的,提供一种面向数据管理的服务,不面向最终分析用户;而数据集市是面向分析应用的,面向最终用户。
应用展现层:谈到应用层,可以联想到货架。顾客可以diy货架中商品的陈列。这里,不同的N个货架就好比顾客对应的N个需求,不同的货架中商品的摆放种类、位置等的最终陈列由顾客决定,增强用户体验感。