- 索引是什么
可以理解为排好序的方便快速查找的一种数据结构,索引有很多种,这里介绍BTree类型的索引。
索引虽然可以提高查询速度,但是索引也是一张表,是要站内存空间的,并且索引会降低更新表的速度,因为要维护索引,所以在更新表的时候,要对索引进行更新,导致更新表的速度会降低。 - 索引创建情况分析
- 创建索引的最佳时机
- 表的主键和唯一值是自动创建主键索引和唯一索引的
- 经常用于查询和排序的字段
- 查询中用于统计或分组的字段
- 与其它表关联的外键
- 不该创建索引
- 表记录太少,数据量较少的表,使用索引查出来的数据如果超过总数量的5%,那么不建议创建索引,如果数据量比较大的表,那么查出来的数据量超过总量的25%,也不建议创建索引
- 经常插入修改删除的字段,也不适合创建索引
-
BTree索引
注意: 非叶子节点不存储真实数据,只存储索引值,叶子节点存储真实数据,真实数据都在叶子结点上
-
使用explain查看sql执行计划进行优化
使用方法,explain+sql语句,如:explain select * from student where id>10
名次解释:(table就是查询中用到的哪张表,不做解释)
- id:select 查询的序列号,一组数字,表示查询中执行select字句操作表的顺序,其中顺序有三种
-
id相同,执行顺序由上至下,如下图:执行顺序为:t1表,t3表,t2表
-
id不同,如果是子查询,id的序号会递增,id值越大优先级越高越先被执行,如下图:执行顺序为:t3表,t1表,t2表
-
id相同不同同时存在,id相同的为一组,由上往下执行,id大的优先执行的规则,如下图:执行顺序为:t3表,<deriverd2>表,t2表
- select_type:查询类型,主要用于区别普通查询,联合查询,子查询等复杂查询有如下几个值:
- SIMPLE:简单的select查询,查询中不包含子查询或union
- PRIMART: 查询中若包含任何复杂的子查询,最外层被标记为PRIMARY
- SUBQUERY:在select或where查询重包含子查询
- DERIVED:在from列表中包含的子查询被标记为derived(衍生), MySQL会递归执行这些子查询,把结果放在临时表中
- UNION:若第二个select出现在union之后,则被标记为union,若union包含在from字句的子查询中,则外层select被标记为deriverd
- UNION RESULT:从union中获取结果的select
- type:访问类型排序,显示查询使用了何种类型,从最好到最差依次是:system>const>eq_ref>ref>range>index>all(重要的指标),一般优化到range级别,最好到ref
- system:表只有一行记录(等于系统表),这是const类型的特列,平时不会出现,可以忽略不计
- const:表示通过索引一次就找到了,const用于比较primary key或者unique索引,因为只匹配一行数据,所以查询速度很快,如where id = 5;
- eq_ref:唯一性索引扫描,对于每个索引键,表中只有一行与之匹配,常见于主键或唯一索引扫描。
- ref:非唯一性索引扫描,返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,但是可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体。
- range:只检索给定范围的行,使用一个索引来选择行,key列显示使用了哪个索引,一般就是在where语句中出现了between,<,>,in等查询,这种范围扫描,索引扫描比全表扫描要好,因为它只需要开始索引的某一点,而结束另一点,不用扫描全部索引
- index:index与all的区别为in的类型只遍历索引树。这通常比all快,因为索引文件通常比数据文件小,也就是说虽然index和all都是读全表,但是index是从索引中读取,而all是从硬盘中读取。
- all:将遍历全表以找到匹配的行。
- possible_keys: 显示可能应用到这张表中的索引,一个或多个,查询涉及到的字段上若存在索引,则该索引将被列出,被列出的索引不一定真的用到
- 实际使用的索引。如果为null,则没有使用索引,索引中若使用了覆盖索引,则该索引仅出现在key列表中
- key_len:表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度,在不损失精确性的情况下,长度越短越好。key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的
- ref:显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值。
- row:根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数(受影响行数)
- extra:包含不适合在其他列中显示但十分重要的额外信息
- using filesort:说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引排序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序”。
- using temporary 使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序order by和分组查询 group by
- using index:表示相应的select操作中使用了覆盖索引,避免访问了表的数据行,效率不错。如果同时出现using where,表示索引被用来执行索引键值的查找。如果没有同时出现using where,表明索引用来读取数据而非执行查找动作。
- using where:表明使用了where过滤
- 索引优化分析
- 链表查询,例如,
select id,name,sex,class.name from student left join class on student.classId = class.classId
这是索引应该建在class表中的classId字段,因为left join中以左表为准,左表的数据要全部包含进来,而右表中的数据是过滤的,所以索引建右表比较好,建在左表没有太大的影响。同理右连接查询索引建在左表上。(即:永远用小的结果集驱动大的结果集。) - 全值匹配,即查询的条件全部建了索引,如下图:
- 最佳左前缀法则(如果索引了多列,即复合索引,要遵守最左侧前缀法则。指的是,查询从索引的最左前列开始并且不跳过索引的列)
- 复合索引中,带头的索引一定要用,中间的也不能断,不然会导致索引失效,例如,创建了一个name,age,pos的符合索引,查询时,查询条件不按照name,age,pos的顺序来,可能会导致索引的失效,没有了带头的索引name,那么name,age,pos都失效,如果有name没有age,那么pos失效,如果中间的索引或者带头的索引失效,会导致后面的索引都失效。(导致索引失效的情况在4,7,8,9,10,11)
- 不在索引列上做任何操作(计算,函数,类型转换),会导致索引失效而转向全表扫描
- 存储引擎不能使用索引范围条件右边的列
- 尽量使用覆盖索引(脂肪纹索引的查询(索引列与查询列一致)), 减少select *
- mysql 在使用不等于(!= 或者<>)的时候无法使用索引,会导致全表扫描
- like 以通配符开头('%a...')mysql索引失效,会变成全表扫描(%放开头,索引可能失效,%不开头索引不失效)
- 如果查询的列都建了索引,那么使用%开头,索引不会失效
- is null ,is not null 也无法使用索引(所以建表的时候,关键字段尽量避免空值,最好有一个默认值)
- 字符串不加单引号索引失效
- 少用or,用它来连接是索引失效
- 链表查询,例如,