用户行为日志 信令数据 cell mapWithState DStream 整合RDD == transform 数据一:日志信息 DStre...
Spark Streaming 基于Spark之上的流处理 流:source ==> compute ==> store 离线是特殊的流 let...
Function functions.scala hobbies.txt alice jogging,Coding,cooking 3 li...
External Data Source API 外部数据源 MapReduce Hive Spark 加载数据 格式:json、parquet...
DataFrame python pandas R RDD MapReduce DataFrame vs Dataset(1.6) DS: Ja...
1.核心概念 broker: 进程 producer: 生产者 consumer: 消费者 topic: 主题 partitions: 分区 (...
Spark SQL IOE SQL:schema + file select ... from xxx where..... SQL on Ha...
下载地址: Zookeeper: http://mirror.bit.edu.cn/apache/zookeeper/current/ Scal...
Kafka: 消息中间件 -->分布式流式平台 MQ Redis Kafka Flume 生产者 source Broker channe...