索引是一种数据结构,可以帮助我们快速的进行数据的查找.索引的数据结构和具体存储引擎的实现有关, 在MySQL中使用较多的索引有Hash索引,B+树索引等,而我们经常使用的InnoDB存储引擎的默认索引实现为:B+树索引.
hash索引和B+树索引有什么区别?
hash索引底层就是hash表,进行查找时,调用一次hash函数就可以获取到相应的键值,之后进行回表查询获得实际数据.B+树底层实现是多路平衡查找树.对于每一次的查询都是从根节点出发,查找到叶子节点方可以获得所查键值,然后根据查询判断是否需要回表查询数据
1、hash索引进行等值查询更快(一般情况下),但是却无法进行范围查询.因为在hash索引中经过hash函数建立索引之后,索引的顺序与原顺序无法保持一致,不能支持范围查询.而B+树的的所有节点皆遵循(左节点小于父节点,右节点大于父节点,多叉树也类似),天然支持范围
2、hash索引不支持使用索引进行排序
3、hash索引不支持模糊查询以及多列索引的最左前缀匹配.原理也是因为hash函数的不可预测
4、hash索引任何时候都避免不了回表查询数据,而B+树在符合某些条件(聚簇索引,覆盖索引等)的时候可以只通过索引完成查询.
5、hash索引虽然在等值查询上较快,但是不稳定.性能不可预测,当某个键值存在大量重复的时候,发生hash碰撞,此时效率可能极差.而B+树的查询效率比较稳定,对于所有的查询都是从根节点到叶子节点,且树的高度较低.
在建立索引的时候,有哪些需要考虑的因素?
建立索引的时候一般要考虑到字段的使用频率,经常作为条件进行查询的字段比较适合,建立联合索引,还需要考虑联合索引中的顺序,
InnoDB存储引擎支持以下几种常见的索引:
B+树索引
全文索引
哈希索引
哈希索引是自适应的,存储引擎会根据表的使用情况自动为表生成哈希索引,B+树索引是传统意义的索引,目前关系型数据库系统中查找最为常用和最为有效的索引。B+树是从最早的平衡二叉树演化而来的。B+树索引能找的是被查找数据行所在的页,然后数据库通过把页读入到内存,再在内存中进行查找,最后得到查找的数据。
如何理解B+树索引的工作方式?
二分查找: 查找一组有序的记录数组中的某一记录
二叉查找树:
平衡二叉树:
B+树:是一种为磁盘或其他直接存取辅助设备设计的一种平衡查找树,在B+树中,所有记录点都是按键值的大小顺序存放在同一层的叶子节点上,由各叶子节点指针进行连接
聚集索引:
辅助索引: