创始人:DougCutting 道格。卡丁
起源于Nutch(开源网络搜索引擎)
铺垫:谷歌两篇论文1.GFS(分布式文件系统) 2.MapReduce
定义:开源的软件平台,开源的软件框架
Hadoop优势
数据存储:数据块多副本
数据计算:重新调度计算
扩展性
降低成本
Hadoop目前作用:
搜索引擎 百度,谷歌
大数据存储 云存储
大数据研究 数据分析 数据挖掘
科学研究 Strom Spark Flink
hadoop生态系统
hdfs 分布式文件系统
yarn 资源管理调度系统
MapReduce 分布式计算框架
storm 流式处理框架(实时)
spark 基于内存的计算框架
hbase实时分布式数据库
Hive关系式数据库
Pig脚本语言(过程)
Solr搜索