240 投稿
收录了203篇文章 · 281人关注
  • 数仓工程师的技术路线篇

    更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、数据仓库工程师是什么 首先,我要声明一点,数仓工程师不能有一个惯性思维,那便是把自己当成一个...

  • Resize,w 360,h 240
    「Hive进阶篇」万字长文超详述hive企业级优化

    肝了几个晚上,梳理总结了一份万字长文超详述hive企业级优化文章,也整理了一份hive优化总结思维导图和hive优化详细PDF文档,有需要可关注...

  • Resize,w 360,h 240
    「数据湖篇」一文带你深入理解数据湖

    更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、数据湖是什么 数据湖相当于一个汇集着来自各个异构数据源的原生态数据,不经过加工清洗数据,数据...

  • Resize,w 360,h 240
    秒懂zookeeper

    前言 看了很多zookeeper的文章和视频,几乎前篇一律先讲一遍基本使用再讲使用场景,看完还是云里雾里。所以本文换一个角度讲解zookeepe...

    0.5 pq217 1 11
  • Resize,w 360,h 240
    Hive - 总结

    0.补充 0.1 什么是hive 0.2 优缺点 0.3 Hive架构原理 0.4 hive与数据库的比较 由于 Hive 采用了类似SQL 的...

  • Resize,w 360,h 240
    HBase - 总结

    一、HBase简介 1.1 定义 1.2 HBase数据模型 1.2.1 HBase逻辑结构 1.2.2 HBase的物理结构 1.2.3 数据...

  • Zookeeper - 总结

    一、zookeeper入门 1.1 概述 1.2 zookeeper特点 1.3 zookeeper数据结构 1.4 应用场景 1.5 配置参...

  • Resize,w 360,h 240
    销售数据建设-Hive案例分析

    需求:从性别、年龄、 职业、城市、居住年限,婚姻状况等维度找到高质量用户,并查看高质量用户人群的占比,为其提供高价值消费品 (定位高价值消费品以...

  • Resize,w 360,h 240
    人-货-场指标体系建设之SQL案例分析

    1. 用户指标体系(人) 基础指标体系 + RFM模型分析 1.1 基础指标(uv/pv/留存率) 1.1.1 搭建数据表,读取数据并进行预处理...

  • Resize,w 360,h 240
    hive积累大全

    此篇内容:hive自定义函数UDF、UDTF,压缩存储方式,hive优化、hive实际编程基本涵盖了hive基础及常用场景,输出这篇单纯是为了忘...

专题公告

个人网站 : http://www.xcan.top
个人店铺:

鞋盒: https://shop117015562.taobao.com/

男装: https://shop469108515.taobao.com/

Hadoop,Hbase,Hive,Spark,Apache Kafka,Apache Storm,Map reduce,SQOOP,Zookeeper