页是什么?
页是innoDB中管理储存空间的基本单位,页有很多中,存放数据的叫做索引页。其他先不说。
file header
页通用数据page header
页专有数据infimum
supremum
最小记录和最大记录user records
用户记录free space
闲置空间page directory
页面目录,槽file trailer
文件尾部,验证作用
先说说插入一条记录,这条记录是什么样子的
这里重要的几点
n_owned
当前记录的记录数
next_record
下条记录相对位置
delete_mask
标记是否删除
heap_no
当前记录在页中的位置
因为数据储存是一个单向链表,这个值是记录的该条数据真实值,到下一条记录真实值的地址偏移。这样用就可以通过上一条记录找到下一条记录。
下一条记录是指的下一个索引值的记录,而不是插入的顺序。在innoDB中,删除一条数据的操作,只会将delete_mask
标记为1,上一条记录的next_record
会自动变成下一条有效数据的地址偏移。
因为删除这个记录,会需要重排所有记录值,这样性能会有问题,但是被标记删除的记录位置,会变成可重用位置。之后再插入索引值为该位置的时候,会将此处重写。也就是说,单向链表,永远是按照索引顺序排列,新插入未制定索引都会插入到最后位置。
页初始化会有最大最小记录,最大记录的next_record
为0,说明这就是最后一条。
查询中发生了什么?
如果傻瓜式查询,从头开始查,什么时候查到了,什么时候结束,这就太傻了。
所以innoDB觉得不能这么傻,决定搞点东西,让查询更快一些。
于是想到了目录这个东西。
因为所有数据都是在一个链表中,所以要给这个链表做一个目录
目录怎么做?
他会将所有数据,包括最大最小,分组。再将每组最后一条数据的真实数据位置偏移,放在页面的page directory
中,这个就是页的目录了。
每组中最后一条数据的n_owned
是表示该组一共有多少条。
这个分组是什么规则,为啥最小记录自己一组?
规定就是,最小记录分组只能他自己,别问我为什么,规定
最大记录的那组,可以是1-8条,剩下的只能是4-8条
来走一遍逻辑
当一条都没有的时候,最小记录自己一组,最大记录自己一组
当有7条记录的时候,最小记录一组,七条数据和最大记录一组,最大记录的
n_owned
为8在加一条数据的时候,会先去槽中找一下,找索引值比他大,且差值最小的,(因为槽记录的是组中最大的数据)。如果该组到了8条,那就分出去4条成为新的组,剩下四条和这个新数据组成一个组,槽会跟着改变。
组搞好了,那就很简单了,直接用二分法找到对应的槽,然后遍历槽中的数据就可以了。毕竟槽中的数据很少了。
槽中的第一条数据可以通过上一个槽的
next_record
找到。
Page Header(页面头部)
先只说说
PAGE_LAST_INSERT
最后插入记录的位置
PAGE_DIRECTION
记录插入的方向
PAGE_N_DIRECTION
一个方向连续插入的记录数量
如果新插入的记录的索引值,比上一条大(PAGE_LAST_INSERT
可以看到上一条),那就是往右,这就是方向。如果连续方向都是一样的PAGE_N_DIRECTION
就会记录这个数量,方向改变,就会清零。
File Header(文件头部)
FIL_PAGE_OFFSET
页号
FIL_PAGE_PREV
上一个页的页号
FIL_PAGE_NEXT
下一个页的页号
每一页中的数据,是单向链表,也就是每条记录只记录下一条记录位置。
但是页是双向链表,每页会记录上一页下一页。这个是page header是页面特有属性,这个是索引页的属性,不代表所有类型的页都有。
File Trailer
这个是起校验作用的东西
可以分成两部分
第一部分:校验和
和fileheader是一样的,从内存同步到磁盘的时候,会先吧这个写进去。等同步完成,页尾的校验和,会和头部相同。
如果同步一半没电了,那就不会一样。
后面部分也是相同功能。