数据库事务
提到事务,大家都不陌生。在刚开始学习数据库的时候,都接触多转账的例子。这个过程能够准确、顺利的执行靠的是数据库的事务保证的。
简单来说,事务是保证对数据库的一组操作,要么全部成功、要么全部失败。在MySQL中事务支持也是在存储引擎层实现的。第一篇文章中学习到数据库的存储引擎是插件式的,可扩展可切换的,即MYSQL是一个支持多种存储引擎的系统。但是,并不是所有的存储引擎都支持事务。 比如MySQL原生的MyISAM引擎就不支持事务,这也是MyISAM被InnoDB取代的重要原因之一。
这篇文章,还是以InnoDB为例,剖析MySQL在事务支持方面的特定实现,并给予原理给出相应的实践建议。
事务的隔离性与隔离级别
隔离性与隔离级别是事务学习的核心,也是面试中经常被问到的。
提到事务我们会先想到事务的4大特性:ACID(原子性、一致性、隔离性与持久性),这篇文章我们主要来看下其中的I,即隔离性。
而当多个事务同时执行的时候,可能出现“脏读”、“幻读/虚读”、”不可重复读“的问题。为了避免这些问题,就有了”隔离级别“的概念。
在谈隔离级别之前,我们先需要明确一个问题,隔离的越严实,必然会影响效率。因此很多时候我们都需要在二者之间寻找一个平衡点。
SQL标准的隔离级别包括:读未提交(read uncommitted)、读提交(read committed)、可重复读(repeatable read)和串行化(serializable)。
1.读未提交 指一个事务还没提交时,它的变更就能被其他事务看到
2.读提交 与提未提交相反,指一个事务提交之后,他的变更才能被其他事务看到
3.可重复度指一个事务在执行过程中看到的数据,总是跟这个事务在启动时看到的数据是一致的。 当然在可重复读隔离级别下,未提交变更对其他事务也是不可见
4.串行化对于同一行数据,”写“会加”写锁“,”读“会加”读锁“。当存在读与写两个事务冲突时,后访问的事务必须等前一个事务执行完,才能继续执行。
其中,读提交和可重复相对难理解一些。所以准备了一个例子,有一张表T,里面只有一列c
-- 创建表T
CREATE TABLE T (c int) engine=INNODB;
-- 插入一行数据
INSERT INTO T (c) VALUES (1);
现在有两个事务A、事务B是做了这样的事情,在不同的隔离级别下v1,v2,v3的结果是什么:
1.若当前隔离级别设置的是”读未提交“,则v1的值就是2。这是虽然B还没提交,但是根据读未提交的规则定义来看,A是这是已经可以看到B事务的当前执行结果了。V2, v3自然也都是2.
2.若是”读提交“,则V1是1 ,因为B的事务在提交后,A便可以看得到了,所以v2、v3是2
3.若是”可重复读“,根据定义,A执行过程中看到的数据总是跟事务启动时看到的一致,那说明在A提交之前读取的v1,v2都是1. V3是2.
4.若是”串行化“,事务B在执行”1改为2“这个写操作的时候会被锁住。直到A事务提交才可以继续执行,所以v1,v2是1,V3是2
在实现上数据库会创建一个视图,访问的时候以数据库视图为准。
在”可重复读“的隔离界别下,这个视图是在事务启动时创建的,整个事务存在期间都用这个视图。
在”读提交“隔离级别下,这个视图是在SQL语句开始执行的时候创建的。
在”读未提交“隔离级别下,直接返回记录中的最新值,没有视图概念。
在”串行化“隔离级别下,直接通过加锁避免并行访问。
我们可以看到不同隔离级别下,数据库行为是有所不同的。Oracle数据库的默认给级别是“读提交”,因此对于一些从Oracle迁移到MySQL的应用,我们一定要记得将MySQL的隔离级别也设置为”读提交“,不然会发生因隔离性引起的并发访问数据库问题。
配置方式,将启动参数transaction-isolation的值设置为READ-COMMITTED。可以用show variables查看当前值。
mysql> show variables like 'transaction_isolation'
事务隔离的实现
理解了事务的隔离级别,再来看看事务的隔离级别具体是怎么实现的。这里我们展开说明”可重复读“。
在MySQL中,实际每一条日志在更新的时候,都会记录一条对应的回滚日志。记录上最新值,通过回滚可以得到前一个状态的值。
当前值为4,但是当读取这条记录的时候,不同时刻启动的事务会有不同的视图。如图中所示,在视图A、B、C里面对应的记录值分别为:1,2,4,同一条记录再数据库中可以存多个版本,就是由数据的多版本并发控制。对于视图ReadView1要想得到值1,就必须按图中的顺序依次执行回滚操作。
同时我们会发现,即使现在有另外一个事务正在对记录做变更,将值改为5,这个事务跟readviewA,B,C是不会冲突的。
回滚日志总不能一直保留吧?什么时候删除?答案是在不需要的时候删除。
事务的启动方式
MySQL启动事务的方式有以下几种:
1.显示启动事务语句, begin或者start transaction。配套的提交语句是commit,回滚语句是rollback
2.set autocommit=0,这个命令会将这个线程的自动提交关闭。以为着我们只执行一个select,这个事务就启动了,而且并不会自动提交。这个事务持续存在,除非我们主动commit或者rollback,或者断开连接。
有些客户端连接框架会默认连接成功后先执行set autocommit=0。这样导致接下来的查询都在事务中,如果是长连接,就导致了意外的长事务。
所以建议我们总是使用set autocommit=1,听过语句显示的方式启动事务。(commit work and chain这个命令表示提交一个事务,并自动启动下一个事务)
我们可以在information_schema库的innodb_trx这个表中查询长事务。比如下面这个语句可以查找持续时间超过60s的事务:
select * from information_schema.innodb_trx where TIME_TO_SEC(timediff(now(), trx_started)) > 60
概念补充
关于ACID的解释:
原子性
:一个事务可能有多个不同的操作(事务就是一系列的操作),那它也是一个不可分割的单元,要么全执行成功,要么全执行失败。
一致性
:事务执行的前后都是合法的数据状态,不会违背任何的数据完整性,这就是“一致”的意思。
隔离性
:多个事务执行,他们互不干扰。
持久性
:事务一旦提交执行成功,那结果是不可改变的。(事务一旦被提交,那么数据一定会被写入到数据库中并持久储存起来。)
个人博客网站:RelaxHeart网-Tec博客