内存数据对象
缓冲池中的数据也类型有:索引页、数据页、undo页、插入缓冲、自适应哈希索引、InnoDB 存储的锁信息、数据字典信息等。
重做日志缓冲 (redo log buffer)
重做日志缓冲区不需要设置很大的空间,默认是8MB,因为重做日志会在以下三种情况下会将重做日志缓冲刷新到磁盘的重做日志文件中。
- Master Thread 每一秒将重做日志缓冲刷新到重做日志文件中
- 每个事务提交时会将重做日志缓冲刷新到重做日志文件
- 当重做日志缓冲池剩余空间小于 1/2 时,重做日志缓冲刷新到重做日志文件
额外的内存池
在 InnoDB 存储引擎中,对内存的管理是通过一种称为内存堆(heap)的方式进行的。例如,每个缓冲池中的帧缓冲(frame buffer)、缓冲控制对象(buffer control block),这些对象记录了LRU、锁、等待等信息,而这个对象的内存需要从额外内存池中申请。所以在申请了很大的 InnoDB 缓冲池时,也应考虑相应的增大额外内存池的大小。
插入缓冲(Insert Buffer)
对于非唯一索引的插入或更新操作,不是每一次直接插入到索引页中,而是先判断插入的非聚集索引页是否在缓冲池中,若在,则直接插入;若不在,则先放入到一个 Insert Buffer 对象中。然后以一定的频率和情况进行 Insert Buffer 和辅助索引叶子节点的 merge 操作,这时通常能将多个插入合并到一个操作中(因为在一个索引页中)
使用 Insert Buffer 必须满足的两个条件:
- 索引是辅助索引
- 索引不是唯一的
简单来说,就是非唯一索引。因为在插入缓冲时,数据库并不会去查找索引页来判断插入的记录的唯一性,否则就需要离散的读取磁盘,导致 Insert Buffer失去了意义。
两次写(doublewrite)
当 InnoDB 存储引擎正在写入某个数据页到表中,而这个页只写了一部分,比如 16KB 的页,只写了前 4KB 就发生宕机了,这种情况被称为部分写失效(partial page write)。
上面的情况可以通过 redo log 来恢复吗?
redo log 记录的是物理日志,比如偏移量为 800,写 'aaa' 记录
如果这个页本身已经发生了损坏,再对其进行重做是没有意义的。
在应用重做日志之前,用户需要一个页的副本,当写入失效时,先通过页的副本来还原该页,再进行重做,这就是 doublewrite。
doublewrite 步骤
①通过 memcpy 函数将脏页复制到内存中的 doublewrite buffer
②doublewrite buffer 再分两次,每次 1MB 顺序地写入共享表空间的物理磁盘上,然后调用 fsync 函数,同步磁盘,避免缓冲写带来问题
③将 doublewrite buffer页写入各个表空间文件中,此时写入是离散写
doublewirte 是为了提升 InnoDB 存储引擎的可靠性,但是部分从服务器可以通过参数 skip_innodb_doublewrite 禁止 doublewrite 功能,从而提升性能。另外有一些文件系统本身就提供了部分写失效的防范机制,这时候就不需要启用 doublewrite 了。
自适应哈希索引
在生产环境中,B+ 树的高度一般为 3~4 层,所以查询需要 3~4 次IO。而 hash 的查找时间复杂度为 O(1),所以通过建立哈希索引可以带来速度提升,但是哈希索引只能用于等值查询。InnoDB 存储引擎会监控对表中各索引页的查询,去建立自适应哈希索引(Adaptive Hash Index, AHI)。
基于查询 SQL 会创建一个 hash 信息(hash info),hash info 由三部分组成:
① 匹配索引的列数
② 下一列匹配的字节数
③ 是否从左匹配
select * from t where a = 1 and b = 2;
则生成的 hash info可能是 (2, 0, true)
构造 AHI 需要满足以下条件:
① 索引查询的次数足够多,查询次数N1 > 17 (此过程无时间限制)
② 生成的 hash info 被使用的次数 N2 > 100
③ 生成的 hash info 能命中某个数据页,并且命中的该页上的记录数要大于该页上总记录数的 1/16(N3 > 页记录数 * 1/16)
满足以上三个条件,就会建立 AHI,key 为 hash info,value 为指向数据页记录的指针
异步 IO
在需要扫描多个索引页时,用户可以连续发出多个 IO 请求,当全部 IO 请求发送完毕后,等待所有 IO 操作完成。AIO 还有一个优势就是可以进行 IO Merge 操作,比如用户要访问的页为(space, page_no)为:(8,6)、(8,7)、(8,8),每个页的大小为 16KB,那么 AIO 可以从(8,6)开始,读取 48KB 的页。
刷新邻接页
Flush Neighbor Page(刷新邻接页):当刷新一个脏页时,InnoDB 存储引擎会检测该页所在的区(extend)的所有页,如果是脏页,那么一起进行刷新。
通过 AIO 可以将多个 IO 写入操作合并为一个 IO 操作,这个工作机制在传统机械磁盘下有显著的优势。
两个问题:
- 是不是可能将不怎么脏的页进行了写入,而该页之后有会很快变为脏页
- 固态硬盘有着较高的 IOPS,是否还需要这个特性
基于以上两个问题的考虑,InnoDB 1.2x 版本就提供了参数 innodb_flush_neighbors 来控制是否启用该特性。对于传统的机械硬盘建议启用特性,但对于固态硬盘有着超高的 IOPS 性能的磁盘,建议关闭此特性。