1. 生产环境中一条 SQL 执行特别慢,你要如何排查问题?
- 可以查看 SQL 的执行计划。
2. 执行计划怎么用?
- explain 后面加上要执行的 SQL。
3. 执行计划包含了哪些信息?
- id:执行计划的 id,可以看出各表的执行顺序;
- select type:查询类型,simple 是简单查询,subquery 是子查询,primary 是子查询的外层,union 是连接查询,derived 是临时表;
- type:访问类型,效率最好的是 system,表中只有一条记录;const次之,通过索引一次就找到了;eq_ref,唯一索引扫描,效率也很高;ref,非唯一索引扫描;range,用索引在范围内查找;index,全索引树扫描;all,性能最差,全表扫描;
- possible key:可能用到的索引;
- key:用到的索引;
- extra:重要且不适合在其他列显示的信息,比如 using filesort 表示出现了文件内排序,性能十分差;using temporary 表示使用了临时表,性能也不好;using index 表示用了索引,性能还可以;impossible where,表示 where 后面的条件总是 false。
4. 一张表有千万级的数据,你怎么优化?
- 建立适当的索引;
- 使用缓存;
- 做读写分离;
- 垂直拆分,将字段多的表拆分成多张表;
- 水平拆分,比如 id 为 1 到 50w 的放到第一张表,50w 到 100w 的放到第二张表。
5. 聚簇索引和非聚簇索引在查询数据时有什么区别?
- 聚簇索引更快,因为叶子节点存放的是数据行,不需要回表查询。
6. 非聚簇索引一定要回表查询吗?
- 不一定,正常情况是查到拿到叶子节点存储的主键的值,然后再根据主键值去做回表查询,但如果是索引覆盖的情况,就不需要回表查询了。
7. 什么叫索引覆盖?
- 索引覆盖就是查询的字段都建了索引,数据可以直接从索引中获取,不需要查询数据表。
8. 使用索引有哪些优缺点?
- 优点:提高检索效率,提高排序的效率;
- 缺点:降低了写数据的效率,因为写数据的同时还要维护索引;索引也占用额外的空间。
9. 如果要对用户密码字段建索引,你打算建什么索引?
- 密码字段可以用前缀索引,比如用密码字段的前 10 位做索引,因为前 10 位的标识度也够高了。前缀索引可以节省空间。
10. 创建联合索引的时候怎么确定哪个字段放前面?
- 识别度最高的字段放到最前面,这样可以提高效率。
11. MySQL 5.6 开始对索引做了什么优化,了解吗?
- 做了索引下推的优化,索引下推可以减少回表查询的次数。比如建立了联合索引
index(name, age)
,然后查询select * from user where name like '张%' and age = 20
,没有索引下推的话,MySQL 会把name like '张%'
的数据都返回到 MySQL 服务端,服务端再去判断这些数据的 age 是否为 20;而有了索引下推的话,查询的时候会先判断name like '张%'
的这些数据 age 是否为 20,不是的直接忽略。
12. 你认为哪些情况适合建索引?哪些情况不适合建索引?
- 频繁作为查询条件的字段、排序字段、统计和分组的字段以及与其他表关联的字段应该建立索引;
- 频繁更新的字段以及字段值大量重复的不适合建立索引。
13. 使用索引的时候你会遵循哪些原则?
- 全值匹配是最理想的状态,即查询条件字段都建立了索引且顺序和索引顺序一致;
- 遵循最左前缀法则,比如索引顺序是 A、B、C,那么查询条件一定要有 A,否则 B 和 C 都会失效;中间索引页不能断,如果查询条件是 A 和 C,少了 B,那么 C 也会失效;
- 索引列上不要做任何计算,计算将导致索引失效;
- 范围之后的列索引会失效,比如
name like '张% and age = 20'
,那么 age 这个索引将失效;- 写模糊查询时百分号要写右边,否则索引失效;
- 不要写
select *
,用到什么列就查什么列,这样可以增加索引覆盖的机率;- 不等于、is null、is not null、or 这些都会导致索引失效;
- 字符串的引号不能漏写,否则索引会失效。
辅助记忆,诗曰:
全值匹配我最爱, 最左前缀要遵守;
带头大哥不能死, 中间兄弟不能断;
索引列上少计算, 范围之后全失效;
模糊百分写最右, 覆盖索引不写星;
不等空值还有或, 索引失效要少用;
字符引号不可丢, 牢记以上就无忧。