快乐大数据 - 简书

IP属地：北京

快乐大数据第12课数据平台实战
#数据平台实战 #1配置maven，tomcat，cbord的过程略 #2.在node01 启动mysql mysql -h192.168.18...

309 0 0
快乐大数据第11课 Spark Stream
第一部分：Stream程序设计原理 #SparkStreaming设计动机很多重要的应用要处理大量在线流式数据，并返回近实时的结果 • 社交网...

456 0 0

快乐大数据第10课 SparkSQL
i:10010#SparkSQL概述及原理提供了两种操作数据的方式? SQL查询? DataFrame和DataSet API1提供了非常...

218 0 0
快乐大数据第9课 Spark程序设计
#启动Spark JobHistoryServer第一步：修改yarn-site.xmlyarn.log.server.urlhttp://19...

315 0 0
快乐大数据第8课 Spark计算引擎概述
(一)本地模式启动在node01上cd ~/apps/spark2.2 bin/spark-shell定义变量val rdd = s...

260 0 0
快乐大数据第7课 Flume日志收集系统
Flume 日志收集系统 #安装在node01下在hadoop用户下 cd ~/apps 在此路径下解压后是 flume-1.8.0 ll...

543 0 0
快乐大数据第6课 Kafka
Kafka 定义topic 类似于一个表存储相同格式，有顺序的数据，传到kafka里面的数据叫消息。按照磁盘顺序来读写数据通过多分区，多副...

308 0 0

快乐大数据第5次课 hive
快乐大数据第5次课 hive（1）工作原理Hive的执行入口是Driver，执行的SQL语句首先提交到Drive驱动，然后调用compiler解...

401 0 0
快乐大数据第四课 Mapreduce的优化
快乐大数据第四课 Mapreduce的优化 1.Shuffle的过程（1）每个Mag Task把输出结果写到内存中的环形缓冲区；当内存环形缓冲...

273 0 0