这个索引真的是面试必考题,但是我也不知道面试官问这玩意有啥用,回答都是百度的,问一百个人,90个人回答的一样,剩下是十个人是没背下来。
而且背了容易忘。我就是被了好几遍都记不住。
所以我决定看看索引到底是个什么东西,知道了原理,也就很难忘记了。
索引这个东西常见这几种:
1.普通索引
2.唯一索引
3.主键索引
4.联合索引
我们先来所以下主键索引是怎么搞的,其他索引类似。
这篇文章中讲了在InnoDB的索引页中是怎么根据主键查数据的。
但是问题是,索引页多了怎么办?
不还是要从第一个页查起,一个一个去查。这样有一万个页,不还是会有问题。
所以为了解决这个问题,新搞了一个一种记录
之前record_type
就是记录中表示记录类型的地方。
0表示普通记录
1目录项记录
2表示最小记录
3表示最大记录
因为页内,有槽作为目录,可以使用二分法快速查询,那页我们也来搞一个目录
下图中的key
就是该页最小索引值,page_no
就是页号
这样的话,如果我们去查索引为6的数据,就现在目录中查,知道了在28页,在用页内查询办法,去查询。
但是这些目录要存起来啊,所以就把这一条一条数据变成了一条目录项记录,这条记录的record_type
就是1
把这样的多条数据放在一个页中
就组成了这样的一个东西。
数据量继续增加,导致目录项记录的页页特别多,那就意思类推,在向上建立目录项记录页。最后层层向上,最终形成如下
这就成了树,也就是B+树。
这些页,都统一称作节点
最下层节点称作叶子节点/叶节点
用来存放目录项的节点成为非叶子节点/内节点
最上层称作根节点
所有叶子节点是存放用户数据的
所有内节点是存放目录记录数据的
有两个特点:
1.使用记录主键值的大小进行记录和页的排序,分为三方面
页内记录是按照主键大小顺序拍成一个单向链表
各个存放用户记录的页也是根据页中记录的主键大小顺序拍成的一个双向链表
存放目录记录的页,分为不同的层次,在同一层次,也是按照记录记录的主键大小排序
2.叶子节点储存的是完整的用户记录
具有这两种特点的B+树成为聚簇索引,这也是InnoDB中数据储存的方式。
二级索引
上面说的只是主键索引,但是查别的时候不久不可以了吗?
所以按照别的列搜索怎么办?
那就再栽一棵树。
这里的树排序方式不是按照索引,而是按照特定的列去排序。并且数据记录中只有主键和索引值。
目录记录页中的数据也是索引列和主键(主键的存在是为了唯一)
所以创建这样一个树之后,在去按照该索引列查数据的时候,是先在这个树中查出来主键,在去聚簇索引中根据主键查出所有数据。
也就是说,这样查了两个树,第二次也被称为回表
。
联合索引
有时候可能会有列1和列2进行联合索引
这样就是在二级索引的基础上加上一列。
排序方式是先按照列1进行排序,有相同的在按照列2排序。
根节点
前面的叙述,感觉上像是先有的用户记录,然后在向上产生内节点,根节点。但是事实不是这样的。
首先一个表创刊一个B+树索引的时候,都会创建一个根节点。最开始啥都没有,就是个空页。
然后慢慢填充,一开始按照正常的页去填充,知道这个页满了。
如果在添加一条数据,这个根节点的页就会将所有的用户记录复制一份到新的页,然后进行页分裂(因为一个页不够装了)。这时候根节点就会变成目录记录页。
待目录记录页装满之后,还会复制到新的页中进行页分裂,增加一个层级。
根节点的页码万年不变。