在讲隔离级别之前先了解一下并发事务会带来的问题
- 脏读:事务A修改的数据还未提交,就被事务B读取到了,这时候事务A回滚了,事务B读取到的就是脏数据
- 不可重复读:事务A第一次读到count的值为1,此时事务B已经更新了count的值为2,此时事务A再次读取count时,读取到的值是2(同一个事务里不可以重复读到相同的数据简称不可重复读,事务B里面修改了数据)
- 幻读:事务A读取到了事务B提交的新增数据,不符合隔离性(幻读是事务B里面新增了数据)
事务的隔离级别
- read uncommitted(读未提交):一个事务还未提交,它所做的变更就可以被别的事务看到
- read committed(读已提交):一个事务提交之后,它所做的变更才可以被别的事务看到
- repeatable read(可重复读):一个事务执行过程中看到的数据是一致的。未提交的更改对其他事务是不可见的
-
serializable(串行化):对应一个记录会加读写锁,出现冲突的时候,后访问的事务必须等前一个事务执行完成才能继续执行
查看当前数据库的事务隔离级别: show variables like 'tx_isolation';
设置事务隔离级别:set tx_isolation='REPEATABLE-READ';
事务的隔离级别实现原理(MVCC)
多版本并发控制(MVCC,Multi-Version Concurrency Control)是一种数据库管理系统用于实现不同隔离级别的并发性控制机制。MVCC通过在数据库中保留不同版本的数据(undoLog)来允许多个事务同时操作数据库而不相互干扰。每个事务只能看到适合其隔离级别的数据版本,从而确保数据的隔离和一致性。以下是MVCC的详细解释:
- 数据版本:在MVCC中,每行数据都可以有多个版本。每个版本都有一个相关的时间戳,表示其创建时间。新的版本是通过事务的写操作创建的。因此,每个数据行可以同时存在多个版本,每个版本都与事务操作相关联。
- 事务时间戳:每个事务在启动时都会被分配一个唯一的时间戳,用于确定其读取的数据版本。这个时间戳与事务的启动时间相关联。
- 读操作:当事务执行读操作时,数据库系统会使用事务的时间戳来选择适当的数据版本。通常,事务只能看到那些时间戳早于或等于事务时间戳的数据版本。这确保了事务只能看到在其启动之前已经提交的数据版本,防止了脏读和不可重复读。
- 写操作:当事务执行写操作时,它会创建新的数据版本,将其时间戳与事务的时间戳相关联。这意味着事务修改的数据版本是新的,其他事务在读取时不会看到这个新版本,直到事务提交。
- 事务的隔离级别:MVCC允许数据库系统根据事务的隔离级别来确定哪些数据版本对每个事务是可见的。不同的隔离级别决定了事务可以看到的数据版本范围。例如,在"读已提交"隔离级别下,事务只能看到其他已提交事务的数据版本,而在"可重复读"隔离级别下,事务只能看到其启动时的数据版本。
- 数据版本的维护(是基于mysql的undoLog):数据库管理系统需要管理数据版本的创建、维护和清理。通常,旧的未使用的数据版本会被定期清理,以避免数据库膨胀(有一块固定的地址,不会一直无限添加)。
MVCC的实现原理(基于undo_log)
MVCC和undo日志之间的关系在于,undo日志用于保存原始数据的版本,以便在事务需要回滚或其他事务需要访问旧版本数据时使用。
这些undo日志记录与MVCC的时间戳机制协同工作,以确保事务可以看到适当版本的数据,并支持隔离级别的实现。
mvcc的那些旧版本数据都是在undoLog里面查询的,当是可重复读的时候需要生成一份快照,其实没有重新创建一份数据,只是保存了当前事务开启的事务id,然后查询undolog的时候去判断在这个事务id之前的读取到,在这个事务之后的相当于后来的,就不会读取了
MVCC实现各个隔离级别的方式
读未提交(Read Uncommitted):在这个隔离级别下,事务可以看到其他事务尚未提交的数据版本。事务对数据版本的选择基于事务的启动时间戳和其他事务的提交时间戳,但没有强制限制事务只能看到已提交的数据版本。这意味着在读未提交隔离级别下,事务可以看到其他事务尚未提交的脏数据,因此可能出现脏读。
读已提交(Read Committed):在这个隔离级别下,事务只能看到其他已提交事务的数据版本。事务的查询结果只包括那些已提交的数据版本,而不包括尚未提交的数据版本。这防止了脏读,但仍然允许不可重复读和幻读问题出现。
可重复读(Repeatable Read):在这个隔离级别下,事务在启动时创建一个一致性快照(其实只是记录当前的事务id,在当前事务id之后的数据不查询出来,保证前后数据一致),包含数据库中所有数据的当前状态。在整个事务的执行过程中,事务只能看到它启动时的数据版本。因此,事务不会看到其他事务尚未提交的数据版本,从而防止了脏读和不可重复读。幻读问题在可重复读隔离级别下仍然可能出现,因为其他事务可以在事务执行期间插入新行。
串行化(Serializable):在这个隔离级别下,事务的隔离是最严格的。事务只能看到已提交的数据版本,并且其他事务无法并行修改相同的数据行,因为数据行会被锁定。这避免了脏读、不可重复读和幻读问题,但可能会对并发性能产生较大影响。
随着隔离级别的提高,数据版本的选择和可见性受到更严格的控制,从而确保了数据的一致性和隔离性。不同数据库管理系统的具体实现方式可能有所不同,但核心概念是使用时间戳和事务的启动时间戳来确定事务可以看到的数据版本范围。
既然可重复读是使用mvcc来做快照的,为什么会有幻读的问题呢
理论上mvcc读取的是快照,不会读取到后面修改的数据,但是这里面有两个概念,一个是快照读,一个是当前读
- 快照读 简单的查询select读取的是快照读
- 快照读不会锁定被读取的行,它们仅仅读取数据的一个快照,而不影响其他事务的进行。
- 这允许其他事务在执行快照读操作期间修改或插入被读取的行,因此快照读提供了更高的并发性。但是,快照读操作可能导致在不同时间点读取的数据不一致,因为其他事务可能已经修改了数据。
- 当前读,当涉及到,insert,update,delete,(for update,for share等),这些语句在执行前都会现查询一下,这时候就会使用当前读,当前这条语句会去导致快早更新为读取数据库里的最新数据,
- 当你执行当前读时,MySQL会获取共享锁(S锁)或排他锁(X锁)来锁定读取的行,以确保在事务结束之前其他事务不能修改或插入这些行。
- 这意味着其他事务无法在当前事务正在执行当前读操作期间修改或插入被读取的行。
当前读操作能够提供更严格的一致性,因为它们阻止其他事务在读取期间对数据进行修改。
所以结论是:如果语句没有insert,update,delete,for update,insert等会导致当前读的情况下,其实可重复读也是可以保证没有幻读的情况出现,但是在有这些语句的时候就没有办法了
insert幻读示例:
事务A | 事务A | 事务A |
---|---|---|
begin | begin | |
select * from account where id = 2; | Empty set (0.00 sec) 没有数据 | |
INSERT INTO account (id , name ) VALUES (2, 'n2');commit; |
此时事务B插入数据并提交事务 | |
select * from account where id = 2; | Empty set (0.00 sec) 没有数据 | |
INSERT INTO account (id , name ) VALUES (2, '23'); |
事务A执行插入一条id为2的数据 | |
ERROR 1062 (23000): Duplicate entry '2' for key 'PRIMARY' | 插入报错,读取到了事务B插入的数据 |
update幻读示例:
事务A | 事务A | 事务A |
---|---|---|
begin | begin | |
selct balance from account where id = 1; | 此时balance为0 | |
update account set balance =100 where id =1; commit | 此时事务B修改balance为100并且提交事务 | |
selct balance from account where id = 1; | 此时事务A查询结果还是0 | |
update account set balance = balance+100 where id =1; | 此时事务A更新balance | |
selct balance from account where id = 1; | 此时事务A查询结果是200,出现幻读 |