(本片博文是《MySQL技术内幕 InnoDB存储引擎第二版》的读书笔记)
这是《MySQL技术内幕 InnoDB存储引擎》一书中的InnoDB存储引擎体系结构图。
多线程
InnoDB存储引擎是多线程的模型,因此其后台有多个不同的线程,负责处理不同的任务:
- Master Thread
一个核心的后台线程,主要负责将缓冲池中的数据异步刷新到磁盘,保证
数据的一致性,包括脏页的刷新、合并插入缓冲、UNDO页的回收等。 - IO Thread
InnoDB存储引擎大量使用了AIO(Async IO)来处理写IO请求,这样极大地提高了数据库的性能。IO Thread的工作主要是负责这些IO请求的回调处理。 - Purge Thread
事务被提交后,其所使用的undolog可能不再需要,因此需要Purge Thread来回收已经使用并分配的undo页。 - Page Cleaner Thread
Page Cleaner Thread是在InnoDB1.2.x版本中引入的。其作用是将之前版本中脏页的刷新操作都放入到单独的线程中来完成。目的是为了减轻原Master Thread的工作及对于用户查询线程的阻塞,进一步提高InnoDB存储引擎的性能。
内存
- 缓冲池
InnoDB存储引擎的基于磁盘存储的,并将其中的记录按照页的方式进行管理。因此可将其视为Disk-base Database,由于CPU速度与磁盘速度之间的鸿沟,基于磁盘的数据库系统通常使用缓冲池技术来提高数据库的整体性能。
缓冲池简单来说就是一块内存区域,通过内存的速度来弥补磁盘速度对数据库性能的影响。在数据库中进行读取页的操作,首先将从磁盘读到的页存放在缓冲池中,这个过程称为“FIX”在缓冲池中。下一次再读相同的页时,首先判断该页是否在缓冲池中。若在缓冲池中,称该页在缓冲池中被命中,直接读取该页。否则,读取磁盘上的页。(和OS中缓存有些类似?)
对于页修改操作,首先修改在缓冲池中的页,然后再以一定的频率刷新到磁盘上。这里需要注意的是,页从缓冲池刷新回磁盘并不是在每次页发生更改时触发,而是通过一种叫Checkpoint的机制刷新回磁盘。这样最也是为了提高数据库的整体性能。
缓冲池的大小会直接影响到数据库的性能,通过配置缓冲池参数innodb_buffer_pool_size可以来设置缓冲池大小。
不能简单的认为缓冲池只是缓冲索引页和数据页,它们只是占缓冲池很大一部分而已,其他比如undo页、插入缓冲、自适应哈希索引、InnoDB存储的锁信息、数据字典信息等都会在缓冲池中缓存,以下是InnoDB存储引擎中内存的结构情况:
InnoDB1.0.x版本开始,就允许有多个缓冲池实例。每个页根据哈希值平均到不同缓冲池实例中。这样就减少了数据库内部的资源竞争,增加数据库的并发处理能力。
LRU List
通常来说,数据库中的缓冲池是通过LRU(Latest Recent Used,最近最少使用)算法来进行管理。访问最频繁的页在LRU列表的前端,而最少使用的页在LRU列表的尾端。缓冲池满时,首先释放尾端页。
InnoDB存储引擎中,用优化过的LRU算法对缓冲池进行管理。LRU列表中加入了midpoint位置,新读取到的页,虽然是新页,但并不直接放入到LRU列表的首部,而是放入到LRU列表的midpoint位置。(这个算法在InnoDB存储引擎中称为midpoint insertion strategy)。默认配置下,该位置在LRU列表的5/8处,可由参数innodb_old_blocks_pct控制。midpoint之后的列表称为old列表,之前的列表称为new列表。可以简单地理解为new列表中的页都是最为活跃的热点数据。