240 发简信
IP属地:内蒙古
  • 240
    PySpark笔记(三):DataFrame

    DataFrame是在Spark 1.3中正式引入的一种以RDD为基础的不可变的分布式数据集,类似于传统数据库的二维表格,数据在其中以列的形式被组织存储。如果熟悉Pandas...

  • 240
    基础-12:15分钟理解KD树

    1. 概述 KD树是一种查询索引结构,广泛应用于数据库索引中。从概念的角度讲,它是一种高纬数据的快速查询结构,本文首先介绍1维数据的索引查询,然后介绍2维KD树的创建和查询,...