维度属性层次 1.固定深度的位置层次 常用的是日期,最关键的是每个层次具有特定的名称 2.具有轻微不整齐的可变深度层次 地理层次...
订单管理-----对于历史变化的观察方法 事实表规范化问题 事实表规范化指,如一个事实表有5个维度,7个事实,那么规范化之后变成了7行,每行5个...
参考DAMA教材,数据质量提升的步骤包括了数据剖析(数据探查)、原因梳理及实施的3步不断迭代循环。 数据剖析 理论上数据质量应该由...
Hive分区表分区字段是日期是比较常见的情形,而在实际查询时,使用分区字段作为条件查询某分区,关联的字段可能是某个date类型的字段,此...
环境:Mac 单机 安装命令 brew install kafka 自带安装zookeeper 配置文件目录:/usr/local/etc/ka...
模块默认路径 import sys,ppint pprint.pprint(sys.path) (比print展示更智能) 在展示的路径中找到s...
在python代码开头,需要添加__metaclass__=type,表示新式类 构造方法 用__init__实现,例如 class foorb...
作业的提交 创建内部的jobsubmiter实例来提交作业,具体步骤 1.向资源管理器 resource manager请求应用ID作为作业ID...
python中最基本的数据结构是序列,序列中最常用的是列表和元组,此外还有字符串,buffer对象,xrange对象,unicode字符串。 列...