《恋上数据结构与算法一》笔记(十)B树

目录
  • 序言
  • B树的特点
  • M阶B树的性质(m >= 2)
  • B树 VS 二叉搜索树
一 序言

B树是一种平衡的多路搜索树,多用于文件系统,数据库的实现。也称(B-tree或B-树)

二 B树的特点
  1. 一个节点可以存储超过2个元素,可以拥有超过2个子节点
  2. 拥有二叉搜索树的一些性质
  3. 平衡,每个节点的所有子树高度一致
  4. 比较矮
image.png
三 M阶B树的性质(m >= 2)
  1. 假设一个节点存储的元素个数为 x
  • 根节点:1 ≤ x ≤ m − 1
  • 非根节点:┌ m/2 ┐ − 1 ≤ x ≤ m − 1(向上取整)
  • 如果有子节点,子节点个数 y = x + 1
    • 根节点:2 ≤ y ≤ m
  • 非根节点:┌ m/2 ┐ ≤ y ≤ m
比如 m = 3,2 ≤ y ≤ 3,因此可以称为(2, 3)树、2-3树 
比如 m = 4,2 ≤ y ≤ 4,因此可以称为(2, 4)树、2-3-4树 
比如 m = 5,3 ≤ y ≤ 5,因此可以称为(3, 5)树
比如 m = 6,3 ≤ y ≤ 6,因此可以称为(3, 6)树
比如 m = 7,4 ≤ y ≤ 7,因此可以称为(4, 7)树

思考:如果 m = 2,那B树是什么样子? ◼
你猜数据库实现中一般用几阶B树? 200 ~ 300

四 B树 VS 二叉搜索树

B树二叉搜索树,在逻辑上是等价的

  • 多代节点合并,可以获得一个超级节点

    • 2代合并的超级节点,最多拥有 4 个子节点(至少是 4阶B树)
    • 3代合并的超级节点,最多拥有 8 个子节点(至少是 8阶B树)
    • n代合并的超级节点,最多拥有 2n个子节点( 至少是 2n阶B树)
  • m阶B树,最多需要 log2m 代合并

image.png
image.png
4.1 搜索

跟二叉搜索树的搜索类似

image.png
  1. 先在节点内部从小到大开始搜索元素
  2. 如果命中,搜索结束
  3. 如果未命中,再去对应的子节点中搜索元素,重复步骤1
4.2 添加

新添加的元素必定是添加到叶子节点

image.png
4.2.1 插入55
image.png
4.2.2 插入95
image.png
4.2.3 再插入98?(假设是一棵4阶B树)

最右下角的叶子节点的元素个数将超过限制
这种现象可以称之为 上溢(overflow)

4.2.4 添加 - 上溢的解决(假设5阶)
  1. 上溢节点的元素个数必然等于m

  2. 假设上溢节点最中间元素的位置为k

  • k位置的元素向上与父节点合并
  • [0, k-1][k + 1, m - 1] 位置的元素分裂成 2 个子节点
    • 这 2 个子节点的元素个数,必然都不会低于最低限制(┌ m/2 ┐ − 1)
  1. 一次分裂完毕后,有可能导致父节点上溢,依然按照上述方法解决 * 最极端的情况,有可能一直分裂到根节点
image.png
4.2.5 添加
image.png
  1. 插入98
image.png
  1. 插入52
image.png
  1. 插入54
image.png
4.3 删除
4.3.1 删除 - 叶子节点

假如需要删除的元素在叶子节点中,那么直接删除即可

image.png

◼删除 30

image.png
4.3.2 删除 – 非叶子节点
  • 假如需要删除的元素在非叶子节点中
  1. 先找到前驱或后继元素,覆盖所需删除元素的值
  2. 再把前驱或后继元素删除

删除 60

image.png
  • 非叶子节点的前驱或后继元素,必定在叶子节点中
    • 所以这里的删除前驱或后继元素 ,就是最开始提到的情况:删除的元素在叶子节点中
    • 真正的删除元素都是发生在叶子节点中
4.3.3 删除 - 下溢
image.png

删除22(假设这是一棵5阶B树)
叶子节点被删掉一个元素后,元素个数可能会低于最低限制(>= ┌ m/2 ┐- 1

这种现象称为:下溢(underflow)

4.3.4 删除 - 下溢的解决

下溢节点的元素数量必然等于 ┌ m/2 ┐ − 2

如果下溢节点临近的兄弟节点,有至少 ┌ m/2 ┐ 个元素,可以向其借一个元素

  • 将父节点的元素 b 插入到下溢节点的 0 位置(最小位置)
  • 用兄弟节点的元素 a(最大的元素)替代父节点的元素 b
  • 这种操作其实就是:旋转
image.png
4.3.5 删除 - 下溢的解决

如果下溢节点临近的兄弟节点,只有 ┌ m/2 ┐ − 1 个元素

  • 将父节点的元素 b 挪下来跟左右子节点进行合并
  • 合并后的节点元素个数等于┌ m/2 ┐ + ┌ m/2 ┐ − 2,不超过 m − 1
  • 这个操作可能会导致父节点下溢,依然按照上述方法解决,下溢现象可能会一直往上传播
image.png
4.3.6 4阶B树

如果先学习4阶B树(2-3-4树),将能更好地学习理解红黑树

◼ 4阶B树的性质

  • 所有节点能存储的元素个数 x :1 ≤ x ≤ 3
  • 所有非叶子节点的子节点个数 y :2 ≤ y ≤ 4

◼添加

  • 从 1 添加到 22

◼删除

  • 从 1 删除到 22
image.png

本文参考 MJ老师的 恋上数据结构与算法


《恋上数据结构与算法一》笔记


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容