240 发简信
IP属地:河南
  • Spark shuffle writer源码解析

    Shuffle分类 一个作业经过spark的DAGSchedule调度器划分为多个stage,同时有些下游的stage依赖上游的stage,这样...

  • Spark RDD的基本特征以及源码解析

    RDD是什么 RDD(Resilient Distributed Datasets)可扩展的弹性分布式数据集,rdd是spark最基本的数据抽象...