spark:
1.需要重复读取同样数据进行迭代计算
2.流式实时
3.内存大,快 内存换存储
4.scala,java
5.交互模式
6.可独立运行,不依托 yarn,hdfs(不是必须)
mapreduce
1.单次读取,类似ETL(抽取转换加载),跑批
2.JAVA
3.没有交互模式
4.磁盘io 存储换内存
5.基于hadoop生态圈,需要任务调度yarn mesos,高可用存储 hdfs alluxio等。
spark mapreduce
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 腾讯大数据http://data.qq.com/article?id=2331 一个数据仓库的构架了。底层HDFS...
- Spark 编程指南 概述 Spark 依赖 初始化 Spark 使用 Shell 弹性分布式数据集 (RDDs)...
- Spark Streaming 编程指南 概述 一个入门示例 基础概念 依赖 初始化 StreamingConte...