1 为什么需要MVCC
用来进行事务回滚操作;
有事务存在读写冲突时,也能做到不加锁,非阻塞并发读
2 undolog
2.1 undolog定义
在InnoDB中的每一条记录实际都会存在三个隐藏列:
DB_TRX_ID:事务 ID,是根据事务产生时间顺序自动递增的,是独一无二的。如果某个事务执行过程中对该记录执行了增、删、改操作,那么InnoDB存储引擎就会记录下该条事务的 id。
DB_ROLL_PTR:回滚指针,本质上就是一个指向记录对应的undo log的一个指针,InnoDB 通过这个指针找到之前版本的数据
DB_ROW_ID:主键,如果有自定义主键,那么该值就是主键;如果没有主键,那么就会使用定义的第一个唯一索引;如果没有唯一索引,那么就会默认生成一个隐藏列作为主键。
版本V1、V2并不是物理上真实存在的,而是每次需要的时候根据当前版本和undo log计算出来的。比如,需要V1的时候,就是通过V3依次执行U2、U1算出来。
可以将这些 undo 日志都连起来,串成一个链表,形成版本链。版本链的头节点就是当前记录最新的值。
2.2 undo log分类
Insert undo log :insert生成的日志,仅在事务回滚中需要,并且可以在事务提交后立即丢弃。
Update undo log:update/delete生成的日志,除了用于事务回滚,还用于一致性读取,只有不存在innodb为其分配快照的事务之后才能丢弃它们,在一致读取中可能需要update undo log中的信息来构建数据库行的早期版本。
2.3 数据删除
删除操作实际上不会直接删除,而只是标记为删除,最终的删除操作是purge线程完成的
purge线程作用
1、清理undo log
2、清除page里面带有Delete_Bit标识的数据行。在InnoDB中,事务中的Delete操作实际上并不是真正的删除掉数据行,而是一种Delete Mark操作,在记录上标识删除,真正的删除工作需要后台purge线程去完成。
2.4 更新主键
聚簇索引和二级索引都无法进行in place update,都会产生两个版本
update分两步执行,先删除该行,再插入一行目标行
2.5 更新非主键
聚簇索引可以in place update,二级索引产生两个版本
聚簇索引记录undo log,二级索引不记录undo log
更新二级索引,同时需要判断是否修改索引页面的MAX_TRX_ID
2.6 删除操作
删除操作实际上不会直接删除,而只是标记为删除,最终的删除操作是purge线程完成的
3 Read View
Read View是InnoDB在实现MVCC时用到的一致性读视图,用于支持读提交和可重复读隔离级别的实现,作用是执行期间判断版本链中的哪个版本是当前事务可见的。
本质上是InnoDB为每个事务构造了一个数组,用来保存当前正在活跃(启动了但还没提交)的所有事务ID。
数组里面事务ID的最小值记为低水位,当前系统里面已经创建过的事务ID的最大值加1记为高水位;这个视图数组和高水位,就组成了当前事务的一致性视图(read-view)。
对于以上事务:
如果在「已提交事务」部分,表示这个版本是已提交的事务或者是当前事务自己生成的,这个数据对当前事务是可见的;
如果落在「未开启事务」部分,表示这个版本是由将来启动的事务生成的,是肯定不可见的;
如果落在「未提交」部分,那就包括两种情况
a. 若当前版本的trx_id在一致性试图中,表示这个版本是由还没提交的事务生成的,不可见;
b. 若当前版本的trx_id不在一致性试图中,表示这个版本是已经提交了的事务生成的,可见。
3 MVCC的工作原理
3.1 MVCC查询的工作流程
3.1.1 查询主键索引
生成Read View读视图
通过主键查找记录,根据记录里的DB_TRX_ID与Read View读视图进行可见性判断
配合DB_ROLL_PTR回滚指针和undo log来找到当前事务可见的数据记录
3.1.2 查询二级索引
由于二级索引由于没有三个隐藏列(DB_TRX_ID,DB_ROLL_PTR,DB_ROW_ID)如何实现一致读,可重复读?
更新二级索引列时,旧的二级索引记录将被删除标记(并非真正的删除),新记录将被插入;
如果二级索引记录被标记为删除,或者二级索引页被更新的事务更新,则不使用覆盖索引技术(要通过聚族索引查找正确版本)。
如果启用了索引条件下推(ICP)优化,首先会通过索引下推过滤掉不符合要求的行,来避免使用聚集索引查找。如果找到匹配的记录,即使在删除标记的记录中,InnoDB也会在聚集索引中查找该记录。
具体查询步骤:
生成Read View读视图
-
比较读视图的up_limit_id与MAX_TRX_ID大小
如果MAX_TRX_ID **小于 **本次Read View的up_limit_id,则全部可见,过滤记录中的有效记录
否则,无法通过二级索引判断可见性,需要一次遍历每条记录,反查到聚簇索引记录,通过聚簇索引记录来判断可见性
3.2 MVCC与隔离级别
MVCC 只在 **Read Commited(读已提交) 和 Repeatable Read(可重读读) **两种隔离级别下工作。
在RC隔离级别下,是每个快照读都会生成并获取最新的Read View,这就是我们在RC级别下的事务中可以看到别的事务提交的更新的原因
在RR隔离级别下,则是同一个事务中的第一个快照读才会创建Read View, 之后的快照读获取的都是同一个Read View,从而做到可重复读
3.3 mvcc能否解决幻读
幻读:在一次事务里面,多次查询之后,结果集的个数不一致的情况叫做幻读。而多出来或者少的哪一行被叫做幻行。
在快照读读情况下,mysql通过mvcc来避免幻读。
在当前读读情况下,mysql通过next-key来避免幻读。
不能把快照读和当前读得到的结果不一样这种情况认为是幻读,这是两种不同的使用。所以mysql的rr级别是解决了幻读的。