下面的图片展现了组成InnoDB存储引擎的内存结构和磁盘结构。
InnoDB内存结构
Buffer Pool缓冲池
缓冲池是缓冲需要被访问的表和索引数据的内存区域。为了加速,缓冲池将频繁访问的数据直接放在内存中处理。在专有服务器(dedicated server)上,通常给缓冲池分配高达80%的总内存。
为了提升大批量读操作的效率,缓冲池被分成了很个页(page),每个页可以容纳多个行。为了提升缓存管理的效率,缓冲池里的块是以链表的形式存放;基于LRU算法的一种变体,很少使用的数据会随着时间被踢出缓存。
如何利用缓冲池将频繁使用的数据留在内存中,是Mysql优化的一个重要方面。
缓冲池LRU算法
缓冲池是按照LRU(least recently used最近最少使用)算法的一种变体来管理的一个链表。当进入新的数据页需要空间时,最近一段时间内最少使用的页会被踢出,然后新进来的页会放在列表的中间。中间点的选择方案是,把列表分成两个子列表:
- 列表头,新页子列表,最近访问过的
-
列表尾,旧页子列表,最近很少访问的
这个算法会将频繁使用的页保留在新页子列表。旧页子列表包含很少使用的页;这些页做好了被踢出的准备。
默认情况下,算法是这样操作的:
- 缓冲池的3/8分给旧页子列表
- 列表的中间点是新页子列表的尾部和旧页子列表的头部的连接处,即新旧子列表的交界点
- 当InnoDB将页读取进缓冲池,最开始是放在中间点。触发读页进缓冲池的操作除了普通的SQL查询,还可以是InnoDB自动执行的
read ahead
操作,即预读功能。
什么是read ahead?
一种异步IO请求机制,预先将一组数据页(一整个区
extent
,64个页page
)放进缓冲池,因为这个区有可能很马上就需要访问,因此提前做好准备。分为linear read ahead
线性预读和random read ahead
随机预读。
- 线性预读
若前一个区内被顺序访问的数据块数量超过一个固定值(innodb_read_ahead_threshold
系统变量),就会预先读取一个下一个区中的所有页(这里读取和访问不是一回事)- 随机预读
一个区内缓存在缓冲池的连续数据页数量一旦超过13,就会将这个区的所有块都预先缓存
访问一个旧页子列表的页会让这个页变‘新’,它会被移动到缓冲池列表的头部,并且是新页列表的头部。如果页的读取是由于被语句需要,则页立即会被标记为已访问并加入新页子列表,如果是由于read ahead机制被预读,则不会立即被标记为已访问(页有可能直到被踢出也都不会被访问)。
缓冲池中的页会按照最近一次访问的时间排序,未被访问的页会慢慢移向列表的尾部。从中间点写入页会导致旧页列表里原有的页往尾部移动。最终会把最久未被使用的哪些页挤出缓冲池。
默认情况下,查询读取的页会立刻被移动到了新页子列表,意味着他们会在缓冲池中存留更长时间。全表扫描(例如Mysqldump
操作,或者没有where条件的select语句)会将大量数据加载进行缓冲池,同时会踢出等量更旧的数据,即使新数据或许很难被再次使用。类似地,通过预读自动被加载进缓冲池之后,一旦被访问,就会移动到新页子列表头部。这些情况都会使得频繁使用的页被挤到旧页子列表,进而被挤出缓冲池。有一种技术是可以优化这种情况的,这项技术通过innodb_old_blocks_time系统变量设置了一个时间阈值(单位为ms),从第一次访问一个页开始,这个时间窗口范围内的访问不会将这个页移动到新也子列表的头部(暂时放在旧页子列表,这个时间窗口过后若仍然需要访问,才会将这个页移动到新列表的头部)。
InnoDB标准监控输出的BUFFER POOL AND MEMORY
部分有一些信息是关于缓冲池LRU算法的操作。