本次Hadoop学习重点是HDFS,所以会从以下方面介绍:
-
HDFS基础
- Hadoop基础架构
- HDFS假设及目标
- HDFS基本概念(块、fsImage、editlog、复本)
- NameNode(存储内容及更新)及DataNode
- FsImage及EditLog
- 复本
- 安全模式
-
HDFS文件
- 操作方式
- 文件读取
- 文件写入
- 压缩
- 序列化
-
Hadoop集群搭建
- 配置(环境配置、Hadoop基本配置、HDFS基本配置)
- HDFS守护进程关键配置(网络、端口等)
- 运维
- 主辅NameNode切换
- 常用工具
- 监控
- 日常维护
- DataNode增删
- 升级
Hadoop内容较多,可能无法一次性写完,会持续补充。
以后也会写一写Hadoop其他方面(如Yarn、MapReduce)的内容。