Innodb核心原理之磁盘结构

innodb架构图

innodb架构主要由两部分组成:in-memory & on-disk,即内存结构和磁盘结构。

架构图:


这里单独介绍一下磁盘结构。


innodb磁盘结构

1.InnoDB的磁盘结构中表空间的作用?

表空间
是innodb物理存储中最高层。
系统表空间
1)系统表空间
物理文件:ibdata1
系统表空间是一个共享的表空间,该空间数据文件默认是ibdata1,通过如下参数查看:

show variables like '%innodb_data_file_path%';

默认文件名ibdata1、大小12M、自动扩展。
在设定了系统表空间自动扩展后,则不可缩减,即使删除系统表空间中的表和索引,也不会缩减其在磁盘中的大小(只是对已删的做标记)。

2)系统表空间
包含的部分:

  • 数据字典:其中包含了表结构信息、数据库名、表名、字段类型和信息、视图、索引、MySQL版本等元数据信息。
  • 双写缓冲:用于保证写入磁盘时页数据的完整性,防止发生写失效的问题。
  • 修改缓冲:内存中change buffer对应的持久化的区域,也是为了保证数据完整性。
  • 回滚日志:记录数据修改前的状态的逻辑日志,实现事务回滚和多版本并发控制。

3)独立表空间
每个表都有自己独立的表空间,每个表的数据和索引都会存在自己的表空间当中。
独立表空间的作用:可以实现单表在不同数据库的文件移动。
独立表空间的存储空间是可以回收的(在删除或清空后)。

4)通用表空间
类似系统表空间,也是共享的,可以存储多个表的数据。相比于独立表空间来说,通用表空间由于是多表共享的空间,消耗的内存更少一点,占用的磁盘空间也会更小一点。
创建通用表空间语法:

create tablespace ts1 add datafile 'ts1.ibd' file_block_size=16384;

file_block_size=16384即指定一页最小16K。文件会被创建在data_dir中。
查看通用表空间语法:

select * from information_schema.innodb_sys_tablespaces where name = 'ts1';

5)回滚表空间
用来保存undo log。undo log默认是保存在系统表空间ibdata1中的,8.0默认有单独的独立表空间文件。
查看回滚表空间路径:

show variables like '%innodb_undo_directory%';

如果显示./则表示默认在系统表空间中,8.0默认表空间名称为undo_001,undo_002。

undo独立表空间设置,0表示不开启undo独立表空间

show variables like '%innodb_undo_tablespaces%';

什么时候需要开启undo的独立表空间?
由于系统表空间不会自动缩减,当出现大事务,undo日志不断增加,ibdata1文件也会不断增大。
所以在5.7中引入一个参数,可以开启undo表空间的自动收缩

show variables like '%innodb_undo_log_truncate%';

默认是OFF。
如果开启则要配置两个或两个以上的undo表空间文件,当有一个写满的时候就会缩减,向另外一个文件继续写入。
MySQL8.0开始对undo表空间进行了分离,初始化后默认就会产生两个undo表空间文件,可进行动态扩容和收缩。

6)临时表空间
用于存储用户创建的临时表,及磁盘内部的临时表。
从MySQL5.7开始采用独立的临时表空间,命名为ibtmp1文件,初始大小为12M,默认无上限。
查看临时表空间文件信息:

select @@innodb_temp_data_file_path;

一般我们还是需要设置一个上限值,避免占用过多磁盘空间。
设置临时表空间大小(例如16M):

set global tmp_table_size=16*1024*1024;
show variables like '%tmp_table_size%';

当查询使用临时表空间过大,超过设置的上限时会报错。

如何监控临时表和临时表空间的使用情况?

show status like '%tmp%';

其中:

  • Created_tmp_disk_tables:表示持久化到磁盘上的临时表数量
  • Created_tmp_tables:表示总的临时表数量

用Created_tmp_disk_tables/Created_tmp_tables得出的值不要超过25%。
如果超过了,则应该加大tmp_table_size的值。
此外,重启数据库也会释放tmp表空间。

2.MySQL如何解决写失效问题?

什么是写失效?
Linux文件系统页(OS page)默认大小是4KB,而MySQL的页(Page)默认大小是16KB。
InnoDB的页和操作系统的页大小不一致,InnoDB的页写入磁盘时就需要分4次来写,
这时候,存在一种情况:
如果存储引擎正在写入页的数据到磁盘时发生了宕机,这时如果只是写了一部分页,比如只写了4K就宕机了,这种情况就被叫做写失效。可能会导致数据的丢失,并且这种页数据的损坏靠RedoLog是无法恢复的。

双写缓冲区Doublewrite buffer
参考:

https://blog.csdn.net/qq_26664043/article/details/135718352

用来解决写失效问题,为innodb数据页提供可靠性。实际上是内存+磁盘的结构。

  • 内存结构:Doublewrite Buffer内存结构是由128个page页构成的,大小是2MB(16K*128)
  • 磁盘结构:Doublewrite Buffer磁盘结构是在系统表空间上,由128个page页构成(2个区,extend1和extend2),大小也是2MB。这些页在磁盘上以Doublewrite File的形式存在。

数据双写的流程:在buffer pool的page页刷新到磁盘真正的位置之前,会将页数据通过memcpy函数拷贝到Doublewrite缓冲区,然后Doublewrite Buffer的内存中的数据页会刷写到Doublewrite Buffer的磁盘上(顺序写,两个连续的1M区域)。这样如果出现宕机,数据页损坏了,但由于双写缓冲区文件是具备一致性的,那么在应用redo log之前,通过该页的副本(在双写缓冲区文件中)来还原该页,然后再进行redo log的重做。因此double write实现了innodb引擎数据页的可靠性。

注:MySQL重启时可以通过校验和来确认是否有错误数据,如果Doublewrite Buffer文件错误了,就从数据文件中拉取原始数据根据redo log得出正确的目标数据,而如果数据文件错误了,则将Doublewrite Buffer中的数据重新写入数据文件。

doublewrite和redo log的关系:
在MySQL的innodb存储引擎中,redo log和double write是配合工作的,确保数据的持久性和恢复能力。
恢复过程中,如果存在损坏的数据页,那么innodb首先就回去双写缓冲区文件中找副本,用副本尝试恢复损坏的数据页,然后再应用重做日志。redo log本质上是物理日志,记录的是 “ 在某个数据页上做了什么修改 ” ,但如果数据页本身已经发生了损坏,redolog来恢复已经损坏的数据块是无效的,数据块的本身已经损坏,再次重做依然是一个坏块。

整个数据页落盘刷新的过程:

  • 1.buffer数据页先copy到double write buffer的内存里;
  • 2.double write buffer的内存数据刷到double write buffer的磁盘上;
  • 3.double write buffer的内存再刷到数据磁盘上;

当MySQL出现异常崩溃时,有如下几种情况发生:

  • 情况一:步骤1前宕机,刷盘未开始,数据在redo log,后期可以恢复
  • 情况二:步骤1后,步骤2前宕机,因为是在内存中,宕机清空内存,和情况1一样
  • 情况三:步骤2后,步骤3前宕机,因为DWB的磁盘有完整的数据,可以修复损坏的页数据

由此我们可以得出结论,double write buffer是针对实际的buffer数据页的原子性保证,就是避免MySQL异常崩溃时,写的那几个data page不会出错,要么都写了,要么什么都没有做。

相关参数:

  • innodb_doublewrite:1时启用doublewrite buffer,0时禁用。默认为1。
  • innodb_doublewrite_files:定义多少个双写文件。默认为2,范围2到127。
  • innodb_doublewrite_dir:双写文件目录。默认为空,即存在数据目录。
  • innodb_doublewrite_batch_size:每次批处理操作写入的字节数。默认为,即innodb会选择最佳的批量大小。
  • innodb_doublewrite_pages:决定每个双写文件包含多少页。默认128.

3.InnoDB表空间结构

参考:

https://blog.csdn.net/qq_62592925/article/details/134721945

不同版本innodb结构与旧版本的区别

5.7版本磁盘结构升级的部分:

  • 可以将undo日志表空间从共享表空间分离,但是需要在安装mysql时由用户指定设置undo文件的数量和大小
  • 增加了临时表空间,存储临时表和临时数据
  • 可以在线动态调整innodb_buffer_pool_size的大小,无需重启数据库

8.0版本磁盘结构升级的部分:

  • 将数据字典和undo都从ibdata1系统表空间中彻底分离出来
  • 临时表空间可以配置多个物理文件,加快处理速度
  • 可以设置一个表空间对应多个物理文件,每个表空间可以给多个表使用
  • 将双写缓冲区从系统表空间中移出来,数据目录下的两个#ib_xxxxx_x.dblwr文件就是
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,242评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,769评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,484评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,133评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,007评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,080评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,496评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,190评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,464评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,549评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,330评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,205评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,567评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,889评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,160评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,475评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,650评论 2 335

推荐阅读更多精彩内容

  • page(逻辑) page应用于InnoDBb表空间包括:系统表空间、单表文件表空间、常规表空间; page_si...
    段一萌阅读 333评论 0 0
  • 前言   本来只是想了解下redo、undo log的机制,但发现好像牵扯挺多知识点,就写了这篇文章记录下。。。 ...
    _Yuck阅读 1,399评论 0 50
  • 从 MySQL 5.5 版本开始默认使用 InnoDB 作为引擎,它擅长处理事务,具有自动崩溃恢复的特性,在日常开...
    雪砺青松灬阅读 552评论 0 0
  • 对于后端开发来说,数据库是我们日常开发中几乎都会使用到的。而且对于许多大型应用来说,往往数据库就是限制其性能的瓶颈...
    wuqke阅读 859评论 0 3
  • 隐##1.物理存储结构 1.1 表空间 MySQL支持两类表空间: 共享、独立不同版本的差异: 5.5版本:默认共...
    Gq赵阅读 983评论 0 1