最近面试被考过两次mvcc,由于理解不够深入,两次啊回答都些许模糊不够深入,其实就是没有完全懂。这两天一直在复盘这个问题,希望下次再被考到不至于像之前那样,看了好几篇资料才搞懂,总的来说部分资料讲得还是不够仔细,思维跟不下去。
下面切入正文:
mvcc语义:全称Multi-Version Concurrency Control,即多版本并发控制,多版本指的就是一条记录被多次修改,每次的修改都对应一个版本,并发控制其实就是说的并发读写同一条记录的控制。
mvcc实现的意思是什么呢?总的来说就是,实现RC(读提交)和RR(可重复读)这两种隔离级别,读提交解决了脏读的问题,可重复读解决了脏读和不可重复读的问题。
那么实现mvcc需要哪些组合起来才能实现呢,总结了下:(一致性视图(read view)+快照读)+当前读+undo log+隐式字段(最近修改事务id+回滚指针),下面解释哈这几个抽象名词:
一致性视图:当前已开启但未提交的事务id组成的数组,注意也包含当前自身的事务id
快照读: 在事务期间只要是普通的select操作都是快照读,上面组合把(一致性视图+快照读)单独括起来,其实就是想告知这个快照读需要根据一致性视图来,快照其实就是这个一致性视图
当前读:select lock in share mode(共享锁), select for update ; update, insert ,delete(排他锁),这些就是当前读的语法,会对读取的记录进行加锁,当前读读的是这条记录的最新版本,也就是最新提交的这个事务对应的数据
undo log: 每一次的增加/删除/修改事务提交都对应着一个数据版本,每个数据版本都有一个事务id,这些数据版本按照先后顺序组合成链表,也就成了undo log,链首就是最新的旧记录,链尾就是最早的旧记录
隐式字段:最近修改事务id指的是当前记录最近提交的更新操作的事务id,回滚指针是指向当前记录的上一个事务版本的数据,也就是指向的undo log
mvcc的操作过程:
1.事务开启时生成一致性视图
2.事务期间的普通查询操作(普通select):执行快照读,找到当前记录的隐式字段最近修改事务id,和一致性视图数组的最小值比较,如果比最小值小,那么说明事务开启之前就提交了,可见,则读取这个事务id对应的数据,如果不是小于最小值,那么和一致性视图的最大值比较,如果大于最大值,说明事务还没创建,则不可见,接着取undo log的上一个事务id进行比对,如果是在一致性视图里面,说明事务还未提交,那么不可见,如果不在一致性视图里,那么说明之前就已经提交了,那么可见,整个流程如果没有找到可见的,那么通过隐式字段回滚指针找到上一个版本的事务id出来进行比较,直到找到可见性为止
3.事务期间的更新操作:会加锁(这里其他事务的更新操作会阻塞等待直到锁释放),执行先读后更新,这里的读是当前读,也就是读取的当前提交的最新版本的数据,事务提交后才会释放锁,其他事务的更新操作才能拿到锁
mvcc与读提交,mvcc与可重复读逻辑的区别:
在读提交隔离级别下,每一个语句执行前都会重新算出一个新的视图
在可重复读隔离级别下,只需要在事务开始的时候创建一致性视图,之后事务里的其他查询都共用这个一致性视图