MySQL的索引在存储引擎层实现,而不是服务层
分类
1、B-Tree索引
- InnoDB使用B+树作为底层实现,是MySQL默认存储引擎的默认索引类型
- 索引对多个值排序的依据是定义表时,索引的定义顺序。
- 查询类型:全键值查询、键值范围索引、键前缀查询
4.限制:如果不是从最左列索引开始,则不能使用索引,不能跳过索引中的列。
2、 哈希索引
- 基于哈希表实现,只有精确匹配所有索引列的查询才有效。只有
Memory
引擎显式支持哈希索引 - 精确查找速度很快(O(1)),除非冲突很多。使用链地址法解决冲突。
3.限制:哈希表不按索引值,而是按哈希值排列的。所以它是无序的,也就不支持排序操作。
不支持部分索引,因为使用所有索隐列来计算哈希值。只支持等值比较。
- 自适应哈希:对于频繁使用的索引,在BTree上再建一个哈希索引。本身仍使用BTree查找,但它使用哈希值进行查找,在where子句中手动指定哈希函数。不建议使用MD5、SHA1作为哈希函数,因为它的返回值是字符串,并且比较长。可以考虑CRC32.
3、空间数据索引:MyISAM引擎支持空间数据索引,使用RTree作为底层实现
4、全文索引:查找文本关键字,而不是直接比较索引的值。使用MATCH AGAINST而不是一般的where。
高性能索引策略
1、独立的列:索引不是表达式的一部分,也不能是函数的参数
如,select * from tb where id = id+1
,一眼看出要找id等于4的行,但程序会先遍历id+1
中的id,找到真正的目标id,再去检索目标id所在的行。
2、前缀索引和索引选择性:这种策略针对长的大型数据或文本。选择足够长的前缀保证选择性,同时不能太长。
selectivity = count(distinct index_column)/count(*)
selectivity ∈[0,1],值越大,说明选择性越强
3、多列索引:注意顺序,将选择性最高的放在前面。
4、聚簇索引: 它是一种数据存储方式,将BTree索引和数据行紧凑地存储在一起。由于一张表不能把数据行放在两个地方,因此一张表只能有1个聚簇索引。
1.优点:
- 把相关数据存储在一起,避免多余的磁盘IO
- 数据访问更快
- 使用覆盖索引(要找的数据就在索引列中)的查询可以直接使用页节点中的主键值
2.缺点- 索引更新代价高
- 二级索引(非聚簇索引)可能更大
- 二级索引需要访问两次,因为二级索引保存的是行的主键值,先去二级索引找主键,再用主键区聚簇索引找数据行。