Mysql默认的事务隔离级别是RR(可重复读),可以避免脏读、不可重复读。那么它的实现原理是什么呢?
MVCC
RR的实现基于Multi-Version Concurrency Control,多版本并发控制。就是说同一时刻数据库中的一条数据可以存在多个版本,而MVCC就是用来控制和管理各个版本数据的手段。它能提高数据库并发能力,较好地处理MySQL的读写冲突,做到尽量不加锁。
MVCC的实现则是基于undo log、read view,下面一一说明。
undo log
定义
undo log 也称回滚日志,是Innodb 存储引擎生成的日志。在数据更新之前,MySQL会先把旧的数据记录到 undo log 日志中,当事务回滚时,可以利用 undo log 来进行回滚。
行的隐藏字段
id | ...... | trx_id(事务id) | roll_pointer(回滚指针) |
---|---|---|---|
1 | ...... | 11 | 0x10001 |
在Mysql的数据行中,其实除了我们定义的常规列外,还有两个隐藏字段:trx_id(事务id)、roll_pointer(回滚指针)。
当事务启动时,会被分配一个事务id,之后该事务对数据行进行改动时,会将自己的事务id写入到该行数据的trx_id,同时将旧的数据写入到undo_log中进行记录,并用roll_pointer来指向旧的数据。
read view
事务在创建后,首次生成sq 读取数据的时候会生成 read view 读视图,读视图中包含以下四列:
creator_trx_id | m_ids | min_trx_id | max_trx_id |
---|---|---|---|
创建该读视图的事务 id | 创建该读视图时数据库中所有活跃的事务id 列表,例如:[11,12] | 创建该读视图时,所有活跃事务中最小的事务id | 指下一个要创建读视图的事务 id,它并不是m_ids中的最大值,需要加以区分 |
在RR隔离级别下,read view是在事务开始(begin)之后、执行第一条sql时创建,创建的同时也就生成了一个新的事务id(直到commit结束),事务会依赖其以保证查询结果保持不变直到该事务结束
RR的流程
事务启动后,在首次执行查询时生成了自己的读视图,其中记载了自己的事务id、创建读视图时数据库中的活跃事务列表、创建读视图时的最小事务id、下一个要创建视图的事务id。
之后每次查询时,都会对比数据行中的trx_id与自己的事务id,如果发现数据行中的trx_id比自己的大,说明该数据已被其他事务修改过了,此时事务就会通过数据行的roll_pointer指针到undo_log中去寻找与自己事务id一致的数据快照。
由于事务整个生命周期中,读视图始终不变,因此可以确保同一事务中的每次查询查到的都是自己操作过的数据(无论该事务中是否有DML操作)。
后记
上面的知识点都是通过各平台的一些资料搜罗来的,里面遗漏了很多细节,不能完全讲清楚,而且这部分内容已经比较深了,要完全掌握的话还得细细斟酌。
准备了一些图但效果不理想,就不发出来了,以后有时间再补一补。