关键词
删除、重建表
0.引子
要了解为什么无法通过删除表数据来释放空间,就要理解 InnoDB 对此类操作的方式。
在开始之前,有一些小问题需要你注意:
- 本节都是在 InnoDB 引擎下的讨论。
- 在 8.0 版本之后,表结构的定义信息存放在系统数据表中,所以这里主要讨论的是表数据。
- 参数 innodb_file_per_table 可以设置一个表是否单独建立一个 .ibd 的文件。建议你设置为 ON(默认)
1.数据删除的流程
1.1复用空间
在 InnoDB 中,使用 B+ 树进行索引,索引结构如下:
假设,我们要删除 R4 这个记录,InnoDB 会将这个记录标记为删除,并在之后插入 ID 为 300 ~ 600 的数据时,复用这个位置。所以,磁盘文件的大小并不会缩小。
同样的道理,如果你删除了整个数据页中的数据,整个数据页将可以被复用,而不会释放空间。即使你使用 delete 删除了表内的所有数据,也不会释放这些空间。
1.2结构空洞
你会发现,在磁盘中,很多空间被标记为“已删除”,但是它的空间并没有被释放,这在外部看来,就是数据的空洞。
不仅是数据的删除,插入数据也会造成数据的空洞。在之前的文章中,我们介绍过了 B+树 索引节点上的空洞。实际上,在数据页中也很容易出现空洞,下面是一个因为数据插入导致数据页分裂而形成空洞的例子:
所以,你可以发现,经过大量增删改的表,在结构上会存在空洞。所以,去除这些空洞,就可以收缩表空间。
这就要通过重建表来达到这个目的了。
2.重建表
你可以使用 alter table A engine=InnoDB 命令重建表,其过程如下:你会发现,在这个过程中,会阻塞表的所有更新,也就是说,它不是 Online 的。在 5.6 之后的版本,引入了 Online DDL(依然是使用上面的语句重建),对这个流程做了优化。
相比于之前的操作,它添加了一个 row log ,用于记录所有对表 A 的操作,在重建之后,就会用该日志对新表进行修改:在这个过程中,有些地方需要注意一下:
- 在 state1 中,alter 语句会拿到这个表的 MDL写锁,在之后的 三个状态中,写锁会退化成读锁。
- 无论如何,重建表都会使用大量的 IO 资源,所以你要避开业务高峰使用。
总结
- 使用 delete 无法缩小表文件的大小。
- 经过大量的增删,一个表会出现很多结构空洞。
- 重建表可以收缩表空间,使用 alter table A engine=InnoDB 即可。
上期问题
在上期文章最后,我留给你的问题是,如果一个高配的机器,redo log 设置太小,会发生什么情况。
每次事务提交都要写 redo log,如果设置太小,很快就会被写满,也就是下面这个图的状态,这个“环”将很快被写满,write pos 一直追着 CP。
这时候系统不得不停止所有更新,去推进 checkpoint。
这时,你看到的现象就是磁盘压力很小,但是数据库出现间歇性的性能下跌。
本期思考
假设现在有人碰到了一个“想要收缩表空间,结果适得其反”的情况,看上去是这样的:
- 一个表 t 文件大小为 1TB;
- 对这个表执行 alter table t engine=InnoDB;
- 发现执行完成后,空间不仅没变小,还稍微大了一点儿,比如变成了 1.01TB。
你觉得可能是什么原因呢 ?
以上就是本节所有内容,希望你能避免空洞的生活。
注:本文章的主要内容来自我对极客时间app的《MySQL实战45讲》专栏的总结,我使用了大量的原文、代码和截图,如果想要了解具体内容,可以前往极客时间