240 发简信
IP属地:北京
  • 新零售项目第七天

    DWB层实现 还有 hive 优化 和 数据倾斜问题 1.DWB层开始按主题划分,日(天)统计宽表,轻度提前聚合操作 解释:轻度提前聚合说的是先...

  • 新零售项目第六天

    DWD实现:纬度退化操作(退维) 本项目老师给我们讲三大宽表 订单明细表宽 主表:订单事实表(拉链表) 1.订单组表 2.订单组支付信息表 3....

  • 新零售项目第五天

    渐变纬 拉链表的设计 dwd层的搭建_三导入方式 全量导入,循环和拉链导入,全量覆盖导入 重点,讲的拉链表。 hive的相关配置导入。

  • 新零售项目第四天

    数仓分层设计 ODS层 元数据层 DWD层 细分数据层(数据的转化和清洗) DWB层 数据降纬 出明细宽表,作为中间数据使用 DWS层 按照主题...

  • 新零售项目第三天

    今天 sqoop 讲完了 sqoop 的安装 从关系型数据库导入到HDFS mysql数据导入hive orc压缩格式用 hcatalog ap...

  • 新零售项目10天

    今天第一天,老师讲了大数据框架 Lambda架构 离线走离线 实时走实时 还有kappa架构 流批一体架构(未来主流) 还有一些大数据环境的工具...

  • 'ETL实战四天

    第四天 对MySQL库的数据进行采集,筛选去除脏数据。 第五天 采集后台日志数据 模拟后台日志数据, 1.读取文件 2.从MySQL元数据库中查...

  • ETL实战五天第三天

    因为线上原因四天课加了一天。 今日总结 完成字符串工具的编写和单元测试 完成时间工具的编写及单元测试 对老师编写的模型理解和解读 完整主业务逻辑...

  • ETL实战第二天

    编写MySQL工具类 编写查询MySQL那些文件被处理的记录方法 查询对比两个列表,找出没有被用的工具方法