推荐质量评价指标 Precision & Recall & F1-Measure 内容过于基础,在此不作详细描述。如有兴趣,请参考以下链接: 准确率(Accuracy), 精...
交替最小二乘法(Alternating Least Squares, ALS) 背景知识 显式数据与隐式数据(Explicit data and implicit data)...
What is RDD in Spark? A Resilient Distributed Dataset (RDD), the basic abstraction in S...
What is Dependency in Spark? 依赖(Dependency)用于表示子 RDD 的一个分区与父 RDD 中的哪些分区相关。 Type of Depe...
What is Spark Partition? 分区(Partitioning)实质上是将数据划分为多个部分。在分布式系统中,分区被定义为将大数据集分割后存储为集群的多个文...