一. 事务
1.1 定义
百度百科
事务(Transaction)是访问并可能更新数据库中各种数据项的一个程序执行单元(unit)。事务通常由高级数据库操纵语言或编程语言(如SQL,C++或Java)书写的用户程序的执行所引起,并用形如begin transaction和end transaction语句(或函数调用)来界定。事务由事务开始(begin transaction)和事务结束(end transaction)之间执行的全体操作组成。
说白了,事务就是一个执行动作集合。这个执行动作集合可大可小,都为了实现某一目的而存在。而且相当坚决,要么全部实现,要么全部失败。要么0%,要么100%。
1.2 特点
事务具有ACID特性,分别是:
- 原子性:一个事务是一个不可分割的整体。虽然它里面可能有更细的动作,但对外界来说,它就是不可再分的最小单位。
- 一致性:由一个数据最终完成态①开始——事务操作——到另一个数据最终完成态结束。
- 隔离性:一个事务不受其它任意外在事务的影响,与外界事务隔离了。我做我的,与外界无关。
- 持久性:事务一旦提交,其对数据库的操作是永久的。 就像谈恋爱,一旦分手了,对深爱着的那一方来说影响也是永久的。
1.3 事务管理模式
管理模式 | 描述 |
---|---|
隐式事务 | 隐式开启,显式结尾 |
显式事务 | 显式开启,显式结尾 |
自动提交事务 | 隐式开启,隐式结尾(默认模式) |
批范围事务 | 只适用于多个活动的结果集(MARS),里面包含显式或隐式事务。有一点要注意的是,当批处理完成的时候,如果事务还没有提交或回滚,那么将自动回滚该事务 |
分布式事务 | 跨越两个或多个数据库的单个数据库引擎实例中的事务。通常由事务管理器管理。分两个阶段(准备阶段,提交阶段)来提交事务 |
1.4 问题
当有多个用户同时访问数据资源时,可能会造成各种并发问题,导致数据不一致,这些问题包括:
- 丢失更新:当多个事务同时操作同一资源时,因为事务的隔离性,每一个事务都不关心其它事务的存在,因为事务的一致性,每个事务的开始和结束都是最终完成态。所以之后完成的事务完全有可能覆盖之前完成事务的操作数据,造成数据丢失。
- 脏读:如果事务A正在操作数据,这个数据不是最终完成态,此时事务B读到了这个中间态②数据,之后A又更改了这个数据,并提交,数据变为最终完成态。那么B之前读到的数据就是不准确的,即脏数据,不应存在的数据。
- 不可重复读:事务A读取数据后,事务B修改该数据并提交,然后A又读了一次,发现读取的数据竟然和上一次的不一样。
- 幻读:事务A读取一个数据集(包含多个数据)后,事务B在这个数据集里进行增加或删除操作。事务A再次读取该数据集,发现某些数据竟莫名其妙的消失或增加了,就像产生了幻觉一般。
1.5 解决问题措施
正是因为并发操作会带来上述问题,所以必须采取一系列的措施,来进行并发控制。
1.5.1 从并发控制方法的角度出发
根据建立并发控制方法的不同,一般分为两类
- 悲观并发控制:用在数据争夺激烈的环境中,非常悲观的认为其他用户也会操作数据,所以锁住整个数据,直到所有者操作完毕才释放锁让别人去操作。
- 乐观并发控制:用在数据争夺不大的环境中,非常乐观的认为其他用户不会操作数据,所以不锁定数据。当发生更新操作时,会去检查其他用户在这个时间段内是否更改了该数据,如果更改了,那么产生错误,发生回滚。
1.5.1 从并发问题本身的角度出发
从并发问题的角度进行描述,那么就引出隔离级别的概念。
隔离级别只影响事务本身的读取操作。这样做是为了防止其受到其他事务更新操作的影响。
ISO标准定义了4个等级的事务隔离级别:未提交读(Read uncommitted),已提交读(Read committed),可重复读(Repeatable read),可序列化(可串行化)(Serializable)。其与并发问题的关系是:
隔离级别 | 描述 | 脏读 | 不可重复读 | 幻读 | 隔离等级 | 并发级别 |
---|---|---|---|---|---|---|
未提交读 | 可以读到中间态的数据 | 是 | 是 | 是 | 最低 | 高 |
已提交读 | 只能读到最终态的数据 | 否 | 是 | 是 | 低 | 中 |
可重复读 | 禁止其他事务修改本事务正在读取的数据 | 否 | 否 | 是 | 中 | 低 |
可序列化(可串行化) | 在本事务完成之前其他事务休想动我范围内的数据 | 否 | 否 | 否 | 高 | 最低 |
常用数据库默认隔离级别
数据库 | 默认隔离级别 |
---|---|
MySQL | 可重复读 |
Oracle | 已提交读 |
SQL Server | 已提交读 |
二. 锁
锁是为了解决同步并发访问的一种机制,其定义了事务与数据之间的依赖关系级别。锁由数据库引擎内部的锁管理器进行管理。数据库引擎内部的查询管理器会去根据访问类型和事务隔离级别来决定用哪一个锁,然后向锁管理器申请,如果没有和其他锁冲突,那么锁管理器就会授予查询管理器该锁。
2.1 锁模式
锁模式 | 描述 |
---|---|
共享锁(S锁) | 允许各个事务读取数据,但是,不允许各个事务修改数据 |
排他锁(X锁) | 不允许任何其他事务修改数据 |
更新锁(U锁) | 为了防止多个共享锁到排他锁转换过程的死锁,多出来个更新锁,让一次只能有一个事务获取更新锁,然后再转化为排他锁从而防止死锁 |
意向锁 | 在上述锁上层结点的锁,方便检查锁冲突,检查优先级高于上述锁 |
架构锁 | 当执行的操作与表架构本身有关时使用 |
大容量更新锁 | 允许多个线程将大容量数据并发的插入同一个表,同时,不允许其他进程访问该表 |
键范围锁 | 可隐式保护范围的数据,防止幻读 |
备注说明:有些锁在特定隔离级别下会有不同的表现,这里就不一一列举了。
本文注释说明:
① 数据最终完成态:一个事务完成之后,持久到数据库的数据,已经跟之前的事务没有了任何关系。和数据库的其他持久化的数据没有任何区别。
②数据中间态:一个事务操作数据过程中的数据状态。此时的数据对外界来说没有任何可靠性。
本文参考资料