整体思路
数据仓库建设的第一步即数据汇集。
在数据汇集时总要先明确数据要同步的范围。一般情况下,只有有意义的数据才会进行汇集。有意义的数据即:
1.有真实的业务含义
2.可以正确的反应业务事实
3.在业务时间范围之内
由以上可得不需要进行数据汇集的数据主要有:
1.配置数据
2.归档数据
3.加工过程中产生的临时数据
举个例子,在数据库中的带有sys、temp、log类型的数据一般是不用进行数据汇集的。
说完了不需要汇集的数据,再说一些数据库中原本不存在但是需要汇集到数据仓库中的数据。这样的数据有各种国标、行标以及数据库中本已有的维表,需要经过摸排以后将摸排的结果添加到数据仓库中。