HDFS =====> 解决存储问题
· MapReduce =====> 解决计算问题
· Yarn =====> 资源协调者
· Zookeeper =====> 分布式应用程序协调服务
· Flume =====> 日志收集系统
· Hive =====> 基于Hadoop的数仓工具
· HBase =====> 分布式、面向列的开源数据库
· Sqoop =====> 数据传递工具
· Scala =====> 多范式编程语言、面向对象和函数式编程的特性
· Spark =====> 目前企业常用的批处理离线/实时计算引擎
· Flink =====> 目前最火的流处理框架、既支持流处理、也支持批处理
· Elasticsearch =====> 大数据分布式弹性搜索引擎
· Python语言:编写一些脚本时会用到。
· 离线/实时项目