240 发简信
IP属地:台湾
  • 120
    数据平台实践①——Flume+Kafka+SparkStreaming(pyspark)

    蜻蜓点水 Flume——数据采集 如果说,爬虫是采集外部数据的常用手段的话,那么,Flume就是采集内部数据的常用手段之一(logstash也是这方面的佼佼者)。下面介绍一下...

  • Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets Guide | ApacheCN

    Spark SQL, DataFrames and Datasets Guide Overview SQL Datasets and DataFrames 开始入门 起始点:...