Mysql索引

索引有什么用?

在生活中当我们遇到不认识的字的时候,可以通过汉语字典,先通过字的部首,根据部首的笔画在《部首目录》中找到这个部首及它在《检字表》中的页码。再数清这个字余下部分的笔画,就在部首下找到相应的笔画栏,找到要查的字及它的页码。或者通过汉语拼音音节查字法(这里就不多介绍了)也可以快速地在上万个字的词典中找到对应的字。
那么在mysql数据中,也存在跟字典一样的索引,可以高效地在上万条的数据中,很快地找到你想要的数据。只不过他们的索引方式不同而已,查询的效率也不一样,那么我们就来看看mysql的一些索引,选择合适的索引,让你的查询更快。

基础·索引的常见模型

这里我先给你介绍三种常见、也比较简单的数据结构,它们分别是哈希表有序数组搜索树

  • 哈希表
    哈希表是以(key-value)的形式存储的一种数据结构,在key不冲突的情况下找value的时间复杂度为O(1)。但是实际中数据量越大,key重复的几率就越高,这个时候重复的key,所对应的value也会形成一个链表,链表的时间复杂度就是O(n)了。但这都不算是他最大缺点。最大的不足之处就是做区间查找的时候就很慢,因为它不是有序的。所以哈希表这种结构适用于只有等值查询的场景。
  • 有序数组
    有序数组在等值查询和范围查询场景中的性能就都非常优秀。
    拿有序的订单号举个例子:
    想要找到某个xxx007的订单号所对应的信息,我们只要通过2分法(时间复杂度O(log(N))),就可以快速的找到你想要的数据。如果是[xxx007,xxx009]这个范围的数据也一样先通过2分法找到xxx007的订单,如果订单不存在那就往右遍历一个,然后直到查到第一个比xxx009大的订单号就可以退出查找,得到你想要的区间数据。
    但是有序数组也有缺点。比如在新增数据的时候,这个数据大小在中间,这个时候就必须要挪动大量的记录位置。所以,有序数组索引只适用于静态存储引擎
  • 搜索树
    二叉树是一个经典的数据结构。我们知道它的时间复杂度是O(log(N))。为了维持这个时间复杂度,我们需要将它整成一颗平衡二叉树,因此更新的时间复杂度也是O(log(N))。
    但是如果树高为10,一次查询可能需要访问20个数据块。在机械硬盘时代,从磁盘随机读一个数据块需要10 ms左右的寻址时间,这就很慢了。为了增加它的效率,我们可以就得让查询访问尽量少的数据块,于是可以把这个二叉树改为n叉树,n取决于数据块大小。以InnoDB的一个整数字段索引为例,这个N差不多是1200。这棵树高是4的时候,就可以存1200的3次方个值,这已经17亿了。由于根节点常驻内存所以在这么大量的数据下只需要访问3次磁盘。


    这是一颗3叉树

B-Tree和B+Tree

目前大部分数据库系统及文件系统都采用B-Tree或其变种B+Tree作为索引结构


B-Tree

B+Tree

先上图可以看到这2种树都是上面所说的n叉树,但是它们也有区别的。

  • B+树的数据只存在叶子节点,而B-树的数据存在于每个节点。
  • B+树给所有叶子节点增加了一个指针让他们首尾相连(没错,是不是想到了上面的有序数组,就是为了区间查询)

所以B-树找到索引key就能立马找到数据了,但是B+树是需要到跟节点下才能拿到数据,所以说同样的内存大小,或者说同样的页大小,B+树比B-树能放更多的数据。将data放到外部存储即可比如磁盘。
看到这里,我想大家就能知道了,是的,Mysql的索引采用的就是B+树的方式。

MyISAM和InnoDB

id | age | name

假如有一张User表,有上面3个字段。id为主键索引,age为辅助索引,name也为辅助索引。那么来看2种索引的实现图


MyISAM根据id找

MyISAM根据age找

InnoDB根据id找

InnoDB根据name找

可以看到MyISAM无论是根据主索引找还是辅助索引找,都能在叶子节点找到地址,然后根据地址直接找到对应磁盘的完整数据。
而InnoDB通过id找也可以。但是当InnoDB通过name这个辅助索引去找,只能找到对应的id,然后再通过id再去找到对应的记录数据。

聚集索引和非聚集索引

可以看到叶节点包含了完整的数据记录。这种索引叫做聚集索引。因为InnoDB的数据文件本身要按主键聚集,所以InnoDB要求表必须有主键(MyISAM可以没有),如果没有显式指定,则MySQL系统会自动选择一个可以唯一标识数据记录的列作为主键,如果不存在这种列,则MySQL自动为InnoDB表生成一个隐含字段作为主键,这个字段长度为6个字节,类型为长整形,相应地我们称MyISAM为“非聚集”索引。所以我们要尽量地缩短主键id,防止辅助索引过大。还有就是最好采用有规律的自增id,防止id插入的时候调整B+树的节点位置。

MyISAM和InnoDB一些其他区别:

  1. 是否支持行级锁 : MyISAM 只有表级锁(table-level locking),而InnoDB 支持行级锁(row-level locking)和表级锁,默认为行级锁
  2. 是否支持事务和崩溃后的安全恢复MyISAM不提供事务,所以强调的是性能,每次查询具有原子性,其执行比InnoDB类型更快。InnoDB 提供事务支持事务,外部键等高级数据库功能。具有事务(commit)、回滚(rollback)和崩溃修复能力(crash recovery capabilities)的事务安全(transaction-safe (ACID compliant))型表。
  3. 是否支持外键: MyISAM不支持,而InnoDB支持
  4. 是否支持MVCC仅 InnoDB 支持。应对高并发事务, MVCC比单纯的加锁更高效;MVCC只在 READ COMMITTED 和 REPEATABLE READ 两个隔离级别下工作;MVCC可以使用 乐观(optimistic)锁 和 悲观(pessimistic)锁来实现;各数据库中MVCC实现并不统一

覆盖索引

针对InnoDB的name这种2次查询才能找到完整数据的方式,我们叫做回表查询。如果是个通过辅助索引的范围查找,那么回表查的次数是不是会有点过分了呢?我们是否有解决方法呢?

select id from User where age = 18;

哈哈,因为InnoDB辅助上是能拿到主键索引的,所以这么查,我们就不需要回表了。因为有的业务场景我们可能只需要找到一个id就行了“覆盖”了我们的需求,我们称为覆盖索引。

最左前缀原则

1)select id from User where name like 'A%';这条SQL是走索引的
2)select id from User where name like '%A';这条SQL不走索引的

这个在我们建立联合索引的时候很有用:

  • 当你想建(age,name)的联合索引时,还想建一个(name)索引。这时我们只要调整联合索引的顺序为(name,age),就可以省一个(name)的索引空间下来。
  • 但是当你的查询基于(name)、(age)各自查询又有(age,name)联合查询的时候怎么建索引呢。基于上面那一条规则,然后age一般比name短,所以我们可以(name,age),(age) 这么建,是不是又能省空间了。

索引下推

id | name(有索引) | sex(无索引)

当查询一个名字为”阿“开头的,性别为男时

select * from User where name like '阿%' and sex = 1;

这样子我们可以先通过索引快速找到’阿‘开头的所有同学。在通过sex条件判断即可

在MySQL 5.6之前,只能从ID3开始一个个回表。到主键索引上找出数据行,再对比字段值。
而MySQL 5.6 引入的索引下推优化(index condition pushdown), 可以在索引遍历过程中,对索引中包含的字段先做判断,直接过滤掉不满足条件的记录,减少回表次数。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,921评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,635评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,393评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,836评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,833评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,685评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,043评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,694评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,671评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,670评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,779评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,424评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,027评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,984评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,214评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,108评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,517评论 2 343

推荐阅读更多精彩内容

  • 索引 数据库中的查询操作非常普遍,索引就是提升查找速度的一种手段 索引的类型 从数据结构角度分 1.B+索引:传统...
    一凡呀阅读 2,859评论 0 8
  • 转载:http://blog.codinglabs.org/articles/theory-of-mysql-in...
    qf1007阅读 1,282评论 0 0
  • 为何要有索引? 说白了,就是加速查询。什么是索引? 索引在MySQL中也叫做“键”,是存储引擎用于快速找到记录的一...
    whenitsallover阅读 623评论 0 0
  • 你认识他们吗?没错,他们就是电影《头脑特工队》的小特工们,他们的名字是电影女主角莱莉大脑中的控制者,名字从左至右分...
    安娜猫儿阅读 912评论 1 4
  • 曾经,我走过大半个世界,只为找到一个你,而原来你就在我身边,我却没有发现。 现在,我宁愿错过全世界,也不愿再错过你...
    十月小六阅读 262评论 0 1