MapReduce 是一种可用于数据处理的编程模型. Hadoop 可以运行各种语言版本的 MapReduce 程序. 将看到同一个程序的 Java, Ruby, Python 和 C++ 语言版本. MapReduce 程序本质上是并行运行的, 可以将大规模的数据分析任务分发给任何一个拥有足够多机器的数据中心.
2.3 使用 Hadoop 来分析数据
2.3.1 map 和 reduce
- map 阶段
-
reduce 阶段
MapReduce 是一种可用于数据处理的编程模型. Hadoop 可以运行各种语言版本的 MapReduce 程序. 将看到同一个程序的 Java, Ruby, Python 和 C++ 语言版本. MapReduce 程序本质上是并行运行的, 可以将大规模的数据分析任务分发给任何一个拥有足够多机器的数据中心.
reduce 阶段