为什么需要事务隔离
数据库不会只服务于一个客户端,肯定会出现多个请求同时落到数据库上,即使是同一个客户端也会并发执行多个事务。并发操作mysql的同一批数据的时候就有可能出现数据安全问题,主要有:脏写、脏读、不可重复读、幻读这些问题。本质上这些问题就是多事务并发的问题,那事务隔离就是为了解决这些问题而设计的。
认识多事务并发问题
先了解多事务并发会带来什么问题,问题是什么样子的后面才好解决。主要有以下几个问题:更新丢失(Lost Update)或脏写
当个事务操作同一行,然后基于最初选定的值更新该行时,由于每个事务都不知道其他事务的存在,就会发生丢失更新问题。最后的更新覆盖了由其他事务所做的更新。
如上图两个事务都更新id=1,最终持久化的数据只有一个事务的值。假设B事务晚提交,那对A事务来说就莫名奇妙,它更新的50去哪里了?
脏读(Dirty Reads)
一个事务正在对一条记录做修改,在这个事务完成并提交前,这条记录的数据就处于不一致的状态;这时,另一个事务也来读取同一条记录,如果不加控制,第二个事务读取了这些“脏”数据,并据此作进一步的处理,就会产生未提交的数据依赖关系。这种现象被形象的叫做“脏读”。简单点说就是事务A读取到了事务B已经修改但尚未提交的数据。
A事务先更新a=50,B事务读到a=50并做业务处理,但是在往下的时候A事务回滚了,但是B事务的业务却执行成功了。对B事务来说这就是脏读。
不可重读(Non-Repeatable Reads)
一个事务在读取某些数据后的某个时间,再次读取以前读过的数据,却发现其读出的数据已经发生了改变、或某些记录已经被删除了!这种现象就叫做“不可重复读”。简单的说就是事务A内部的相同查询语句在不同时刻读出的结果不一致。
上图所示A事务里面每一次查询id=1的时候 a的值都在变化,这让A事务怎么去处理业务,根本没办法处理,对A事务来说这个a的值就是不可重复读。
幻读(Phantom Reads)
一个事务按相同的查询条件重新读取以前检索过的数据,却发现其他事务插入了满足其查询条件的新数据,这种现象就称为“幻读”。简单的说就是事务A读取到了事务B提交的新增数据。
幻读跟不可重复读有点像,不可重复读是读到数据不一样,幻读是读的数据多了。
A事务第一次查id<10的时候只有两条记录,B事务新增一条,A事务在查的时候却有三条记录,这对A事务来说就是幻读。
好,以上就是多并发事务带来的几个问题,下面看下事务隔离机制是怎么解决的。
认识事务
了解事务隔离机制之前,先了解下什么是事务。事务是由一组SQL语句组成的逻辑处理单元,事务具有以下4个属性,通常简称为事务的ACID属性。
原子性(Atomicity) :事务内的所有操作是一个原子操作,其对数据的修改,要么全都执行,要么全都不执行。主要体现在操作上全部执行或全部不执行。
一致性(Consistent) :在事务开始和完成时,数据都必须保持一致状态。这意味着所有相关的数据规则都必须应用于事务的修改,以保持数据的完整性。主要体现在数据上全部已改成功或没改变。
隔离性(Isolation) :数据库系统提供一定的隔离机制,让事务内的所有操作是独立的,事务之间互不影响。
持久性(Durable) :事务完成之后,它对于数据的修改是永久的,即使出现系统故障也能够保持。
认识事务隔离级别
mysql的事务隔离机制是有四个等级的分别是
1.读未提交,也就是说另一个事务未提交的操作就能读到,这样显然会造成脏读,因为未提交的数据有可能失败,还会造成不可重复读和幻读就更好理解了。未提交的数据都能读到,那其他不管有提交没提交的数据都能被当前事物读到造成数据每次读到都不一样。
2.读已提交,也就是已提交成功的数据才能读到,那脏读是不可能发生的,因为已提交的数据说明是成功的数据,读到的自然不是脏数据。但是依然会造成不可重复读和幻读,其他事物成功修改或新增都被当前事物读到,对当前事物来说就是不可重复读和幻读。
3.可重复读,解决了脏读和不可重复读的问题,但是幻读的可能性还是会存在。比如其他事务插入一条记录ID=100的记录,当前事务查询的时候where id <=100 是不会查到这个记录的,但是当前事务update shere id=100的时候还是能修改的,所以本质上能感知到新增的数据,所以幻读还是会存在。
4.可串行化,解决了脏读、不可重复读和幻读但是代价也是很大的。因为他是用加锁同步的方式实现只能一个事物一个事务的执行,这显然不然满足日常性能要求。
mysql默认的事务隔离级别是可重复读,可以用show variables like 'tx_isolation';查看当前事务的隔离级别。也可以用set tx_isolation='REPEATABLE-READ';来设置当前事务的隔离级别。