InnoDB是一个多版本存储引擎:它保存有关已更改行的旧版本的信息,以支持并发和回滚等事务功能。 此信息存储在表空间中称为回滚段的数据结构中(在Oracle中的类似数据结构之后)。 InnoDB使用回滚段中的信息来执行事务回滚中所需的撤消操作。 它还使用该信息构建行的早期版本以进行一致读取。
在内部,InnoDB为存储在数据库中的每一行添加三个字段。 6字节的DB_TRX_ID字段指示插入或更新该行的最后一个事务的事务标识符。 此外,删除在内部被视为更新,其中行中的特殊位被设置为将其标记为已删除。 每行还包含一个7字节的DB_ROLL_PTR字段,称为滚动指针。 roll指针指向写入回滚段的撤消日志记录。 如果更新了行,则撤消日志记录包含在更新行之前重建行内容所需的信息。 6字节的DB_ROW_ID字段包含在插入新行时单调增加的行ID。 如果InnoDB自动生成聚簇索引,则索引包含行ID值。 否则,DB_ROW_ID列不会出现在任何索引中。
撤消段中的撤消日志分为插入撤消日志和更新撤消日志。 只在事务回滚中才需要插入撤消日志,并且可以在事务提交后立即丢弃。更新撤消日志也用于一致性读取,但InnoDB只有在没有分配一致读的快照的事务之后才能丢弃它们,因为在一致读取中可能需要更新撤消日志中的信息来构建早期版本的 数据库行。
定期提交事务,包括那些只发出一致读取的事务。 否则,InnoDB无法丢弃更新撤消日志中的数据,并且回滚段可能会变得太大,从而填满了表空间。
回滚段中撤消日志记录的物理大小通常小于相应的插入或更新行。 您可以使用此信息计算回滚段所需的空间。
MVVC的行删除
在InnoDB多版本控制方案中,当您使用SQL语句删除行时,不会立即从数据库中物理删除该行。InnoDB只有在丢弃为删除写入的更新撤消日志记录时,才物理删除相应的行及其索引记录。此删除操作称为清除,并且速度非常快,通常与执行删除的SQL语句的时间顺序相同。
如果你以大约相同的速率往表中插入和删除少量批次的行,清除线程开始跟不上删除的操作,并且由于所有“死”行累计,表会变得越来越大,使得所有操作都受到磁盘速率的限制而变得越来越慢。 在这种情况下,通过调整innodb_max_purge_lag系统变量来限制新行操作,并为清除线程分配更多资源。 更多信息,请参见第14.14节“InnoDB启动选项和系统变量”。
多版本和二级索引
InnoDB多版本并发控制(MVCC)以不同于聚簇索引的方式处理二级索引。聚集索引中的记录就地更新,其隐藏的系统列指向可以重建早期版本记录的撤消日志条目。 与聚簇索引记录不同,二级索引记录不包含隐藏的系统列,也不会就地更新。
更新二级索引列时,旧的二级索引记录将被标记删除,插入新记录,最终清除标记删除的记录。 当二级索引记录被标记删除或二级索引页面由较新的事务更新时,InnoDB在聚簇索引中查找数据库记录。 在聚簇索引中,将检查记录的DB_TRX_ID,如果在启动读取事务后修改了记录,则会从撤消日志中检索正确的记录版本。
如果二级索引记录被标记为删除或二级索引页由较新的事务更新,则不使用覆盖索引技术。 InnoDB不是从索引结构返回值,而是在聚簇索引中查找记录。
但是,如果启用了索引条件下推(ICP)优化,并且WHERE语句中的部分条件只能使用索引中的字段来计算pp,则MySQL服务器仍会将WHERE条件的这一部分向下推送到存储引擎,由存储引擎来评估是否使用索引。 如果未找到匹配的记录,则避免聚簇索引查找。 如果找到匹配的记录,即使在删除标记的记录中,InnoDB也会在聚簇索引中查找记录。