一、InnoDB引擎的逻辑数据结构
1.表空间(idb文件),一个mysql实例可以有多个表空间,用于存储记录,索引结构等等
2.段,分为数据段、索引段、回滚段,innodb是索引组织表,数据段就是B+数的叶子节点,索引段即为B+数的非叶子节点。段用来管理多个Extent(区)
3.区,表空间的单元结构,每个区的大小为1M。默认情况下,innodb存储引擎页大小为16K,即一个区中一共有64个连续的页
4.页,是innodb存储引擎磁盘管理的最小单元,每个页的大小默认为16KB。为了保证页的连续性,innodb存储引擎每次从磁盘申请4-5个区
5.行,innodb存储引擎数据是按行进行存放的
a.Trx_id(隐藏字段):每次对某行记录进行事务操作时,都会把对应的事务ID赋值到这个字段中
b.Roll_point(隐藏字段):每次对某行记录进行修改时,都会把旧的版本写入到undolog中,然后这个隐藏列就相当于一个指针,可以通过它来找到修改前的信息
c.version_id(隐藏字段):如果表有主键索引就不会有这个隐藏字段,如果没有系统会在底层默认加上这个字段做隐藏的主键索引
二、InnoDB的内存架构
内存架构主要组成有:
1.Buffer Pool
2.Change Buffer
3.Log Buffer
4.自适应Hash索引
5.InnoDB的后台线程
三、InnoDB的事务原理
我们都知道关系型数据库的事务遵循的原则是:ACID,原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Duration)。
原子性(Atomicity):事务是不可分割的最小操作单元,要么全部成功,要么全部失败
一致性(Consistency):事务完成时,必须所有的的数据都保持一致状态
隔离性(Isolation):数据库提供隔离机制,保证事务不受并发操作影响下能独立运行
持久性(Duration):事务一旦提交或回滚,在数据库中的数据的改变是永久的
原子性,一致性,持久性这三个特性是通过redolog,undolog两个文件来保证的,而隔离性是通过锁,MVCC多版本控制来实现的
1.持久性实现原理
redoLog(重做日志):记录事务提交时候数据页的物理修改,及修改后的值是什么样子的,是用来实现事务的的持久性。
该日志文件是由两部分组成,重做日志缓冲(redo log buffer),重做日志文件(redo log file),前者是在内存中,后者是在磁盘中。当事务提交之后会把事务修改的所有信息都存在该日志中,用于刷新脏页到磁盘,出现数据错误时进行回滚。
流程
执行update,delete操作的时候,会先将数据从idb文件中缓冲到Buffer pool中。然后将变更的数据页先写到Redo log buffer和buffer pool中,然后当update,delete操作commit提交的时候,将内存中Redo log buffer内容写到磁盘的redo log file文件中,以及将buffer pool的变更数据写入idb中,如果buffer pool数据与idb数据出现不一样的时候,就根据redo log file去更新idb数据,保证数据一致性。整个流程先写redo log buffer的操作就叫做WAL。
从性能上来说WAL,这种日志追加的是磁盘顺序IO,性能会比直接写buffer pool然后刷新到磁盘中的这种随机磁盘IO性能高。
使用这种buffer pool的原因:
1.直接写磁盘的随机IO性能差,而写磁盘log日志追加方式的顺序IO性能高。
2.buffer pool 是缓存层,其实就是为了让数据库抗住更高的并发。
2.原子性实现原理
undoLog(重做日志):回滚日志,用于记录数据被修改前的样子,作用包含两个:提供回滚和MVCC多版本控制。
undolog与redolog记录物理日志不一样,它是一种逻辑日志,记录逻辑操作。例如当我们进行delete操作的时候,undolog会记录一条对应的insert操作,当我们记录update stu set a=1 where id= 1时,undolog会记录一条update stu set a = 0 where id = 1的操作,如果操作进行rooback回滚的时候,直接根据Trx_ID去进行回滚从而保证原子性。
undolog销毁:undolog在事务执行时产生,事务提交时并不会立即删除undolog中的信息,因为还会被用于MVCC多版本控制。
undolog存储:undolog采取Segment(段)的方式管理和记录,存在之前说的RollBack Segment(回滚段中),内部包含1024个回滚段。
3.一致性实现原理
一致性实现原理,其实就是根据undoLog与redoLog保证增删改查,事务提交与回滚前后磁盘idb数据与内存中的buffer pool数据的一致性。
4.隔离性实现原理
事务的隔离性是通过:readview+ MVCC + undoLog + 锁 四种技术共同实现的。
readView
ReadView(读视图)是快照读SQL执行MVCC提取数据的依据,记录并维护当前活跃的事务(未提交)ID。
ReadView包含四个核心字段(隐藏):
ReadView生成规则:
不同隔离级别,生成的ReadView的时机也不同:
RC(read commit):针对某行数据在事务中每次执行(每次读)的时候生成快照读ReadView
RR(read repeated):仅在某行数据第一次读的时候生成快照读ReadView
所以事务的隔离性实现原理
总结
InnoDB的引擎结构介绍,让我们更加清晰的了解是如何实现InnoDB的相关的一些特性的。