更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、数据仓库工程师是什么 首先,我要声明一点,数仓工程师不能有一个惯性思维,那便是把自己当成一个...
更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、数据仓库工程师是什么 首先,我要声明一点,数仓工程师不能有一个惯性思维,那便是把自己当成一个...
肝了几个晚上,梳理总结了一份万字长文超详述hive企业级优化文章,也整理了一份hive优化总结思维导图和hive优化详细PDF文档,有需要可关注...
更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、数据湖是什么 数据湖相当于一个汇集着来自各个异构数据源的原生态数据,不经过加工清洗数据,数据...
前言 看了很多zookeeper的文章和视频,几乎前篇一律先讲一遍基本使用再讲使用场景,看完还是云里雾里。所以本文换一个角度讲解zookeepe...
0.补充 0.1 什么是hive 0.2 优缺点 0.3 Hive架构原理 0.4 hive与数据库的比较 由于 Hive 采用了类似SQL 的...
一、HBase简介 1.1 定义 1.2 HBase数据模型 1.2.1 HBase逻辑结构 1.2.2 HBase的物理结构 1.2.3 数据...
一、zookeeper入门 1.1 概述 1.2 zookeeper特点 1.3 zookeeper数据结构 1.4 应用场景 1.5 配置参...
需求:从性别、年龄、 职业、城市、居住年限,婚姻状况等维度找到高质量用户,并查看高质量用户人群的占比,为其提供高价值消费品 (定位高价值消费品以...
1. 用户指标体系(人) 基础指标体系 + RFM模型分析 1.1 基础指标(uv/pv/留存率) 1.1.1 搭建数据表,读取数据并进行预处理...
此篇内容:hive自定义函数UDF、UDTF,压缩存储方式,hive优化、hive实际编程基本涵盖了hive基础及常用场景,输出这篇单纯是为了忘...
专题公告
个人网站 : http://www.xcan.top
个人店铺:
鞋盒: https://shop117015562.taobao.com/
男装: https://shop469108515.taobao.com/
Hadoop,Hbase,Hive,Spark,Apache Kafka,Apache Storm,Map reduce,SQOOP,Zookeeper