通过加锁的方式确实可以做到事务隔离,但是通过加锁的方式,容易导致读写阻塞,并发性能很差,所以innodb采用了MVCC机制。MVCC(Mutil-Version Concurrency Control),就是多版本并发控制。
在Mysql的InnoDB引擎中,只有已提交读(READ COMMITTD)和可重复读(REPEATABLE READ)这两种隔离级别下的事务采用了MVCC机制。
这就使得别的事务可以修改这条记录,反正每次修改都会在版本链中记录。SELECT可以去版本链中拿记录,这就实现了读-写,写-读的并发执行,提升了系统的性能。
1. MVCC主要是通过版本链和ReadView来实现的。
1.版本链
我们先来理解一下版本链的概念。在InnoDB引擎表中,它的每一行记录中有两个必要的隐藏列:
DATA_TRX_ID:表示插入或更新该行的最后一个事务的事务标识符,同样,删除在内部被视为更新,在该更新中,行中的特殊位被设置为将其标记为已删除。行中会有一个特殊位置来标记删除。
DATA_ROLL_PTR:存储了一个指针,它指向这条记录的上一个版本的位置,通过它来获得上一个版本的记录信息。
作用:解决了读和写的并发执行。
2.ReadView
ReadView主要存放的是当前事务操作时,系统中任然活跃着的事务(事务开启后,没有提交或回滚的事务)。
-
ReadView数据结构
ReadView是MySQL底层使用C++代码实现的一个结构体,主要的内部属性如下:- trx_ids:数组,存储的是创建readview时,活跃事务链表里所有的事务ID
- low_limit_id:存储的是创建readview时,活跃事务链表里最大的事务ID
- up_limit_id:存储的是创建readview时,活跃事务链表里最小的事务ID
- creator_trx_id:当前readview所属事务的事务版本号
-
ReadView创建策略
对于读提交和可重复读事务隔离级别来说,ReadView创建策略是不同的,这样才能保证隔离性不同- 可重复读隔离级别:事务开启后,第一次查询的时候创建,之后一直不变,直到事务结束
- 读提交隔离级别:事务开启后,每一次读取都重新创建
也就是说已提交读隔离级别下的事务在每次查询的开始都会生成一个独立的ReadView,而可重复读隔离级别则在第一次读的时候生成一个ReadView,之后的读都复用之前的ReadView。
2. 读提交和可重复读如何实现的呢?
在这两个隔离级别下,事务对于数据的读取,都是通过版本链+表数据。由于版本链中存放的是各个版本的数据,对它读取是按照某种算法来执行的的,即通过ReadView+隐藏字段来进行控制。在innodb中,创建一个新事务的时候,innodb会将当前系统中的活跃事务列表ID存储起来。当用户在这个事务中要读取该行记录的时候,innodb会将该行当前的DATA_TRX_ID该readview进行比较。
-
读取算法(可见范围)
- 设该行的当前事务id为trx_id_0,当前执行的事务ID为cur_trx_id,read view中最早的事务id为up_limit_id, 最迟的事务id为low_limit_id。
- 如果trx_id_0< up_limit_id话,那么表明该行记录所在的事务已经在本次新事务创建之前就提交了,所以该行记录的当前值是可见的;或者trx_id_0==cur_trx_id,表示是同一个事务,所以可见。跳到步骤6.
- 如果trx_id_0>=low_limit_id的话,那么表明该行记录所在的事务在本次新事务创建之后才开启或者还没结束,所以该行记录的当前值不可见.跳到步骤5。
- 如果up_limit_id<=trx_id_0<low_limit_id, 那么表明该行记录所在事务在本次新事务创建的时候处于活动状态,然后二分查找trx_ids,如果trx_id_0等于它们之中的某个事务id的话,那么不可见。跳到步骤5.
- 从该行记录的DB_ROLL_PTR指针所指向的回滚段中取出最新的undo-log的版本号,将它赋值该trx_id_0,然后跳到步骤2.
- 将该可见行的值返回。
通过ReadView创建策略,读提交和可重复读就可以实现各自的隔离级别!