索引是什么
索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分),它们包含着对数据表里所有记录的引用指针。
更通俗的说,数据库索引好比是一本书前面的目录,能加快数据库的查询速度
索引的目的
索引的目的在于提高查询效率,可以类比字典,如果要查“mysql”这个单词,我们肯定需要定位到m字母,然后从下往下找到y字母,再找到剩下的sql。如果没有索引,那么你可能需要把所有单词看一遍才能找到你想要的,如果我想找到m开头的单词呢?或者ze开头的单词呢?是不是觉得如果没有索引,这个事情根本无法完成?
索引的原理
除了词典,生活中随处可见索引的例子,如火车站的车次表、图书的目录等。它们的原理都是一样的,通过不断的缩小想要获得数据的范围来筛选出最终想要的结果,同时把随机的事件变成顺序的事件,也就是我们总是通过同一种查找方式来锁定数据。
数据库也是一样,但显然要复杂许多,因为不仅面临着等值查询,还有范围查询(>、<、between、in)、模糊查询(like)、并集查询(or)等等。数据库应该选择怎么样的方式来应对所有的问题呢?我们回想字典的例子,能不能把数据分成段,然后分段查询呢?最简单的如果1000条数据,1到100分成第一段,101到200分成第二段,201到300分成第三段……这样查第250条数据,只要找第三段就可以了,一下子去除了90%的无效数据。
索引的使用
查看索引
showindexfrom表名;
创建索引
如果指定字段是字符串,需要指定长度,建议长度与定义字段时的长度一致
字段类型如果不是字符串,可以不填写长度部分
createindex索引名称on表名(字段名称(长度))
删除索引
dropindex索引名称on表名;
索引demo
1. 创建测试表testindex
createtabletest_index(titlevarchar(10));
2. 使用python程序(ipython也可以)通过pymsql模块 向表中加入百万条数据
from pymysql import connect
def main():
# 创建Connection连接
conn = connect(host='localhost',port=3306,database='jing_dong',user='root',password='mysql',charset='utf8')
# 获得Cursor对象
cursor = conn.cursor()
# 插入10万次数据
for i in range(1000000):
cursor.execute("insertintotest_indexvalues('ha-%d')" % i)
# 提交数据
conn.commit()
if __name__ == "__main__":
main()
3. 查询
开启运行时间监测
setprofiling=1;
查找第1万条数据ha-99999
select*fromtest_indexwheretitle='ha-99999';
查看执行的时间:
showprofiles;
为表title_index的title列创建索引:
createindextitle_indexontest_index(title(10));
执行查询语句:
select*fromtest_indexwheretitle='ha-99999';
再次查看执行的时间
showprofiles;
注意:
要注意的是,建立太多的索引将会影响更新和插入的速度,因为它需要同样更新每个索引文件。对于一个经常需要更新和插入的表格,就没有必要为一个很少使用的where字句单独建立索引了,对于比较小的表,排序的开销不会很大,也没有必要建立另外的索引。
建立索引会占用磁盘空间
哪些情况需要创建索引
是否需要创建索引内容
哪些情况需要创建索引1、主键自动建立唯一索引
2、频繁作为查询条件的字段应该创建索引
3、查询中与其他表关联的字段,外键关系建立索引
4、频繁更新的字段不适合建立索引,因为每次更新不单单是更新了记录还会更新索引
5、WHERE条件里用不到的字段不创建索引
6、查询中排序的字段,排序的字段若通过索引去访问将大大提高排序速度
7、查询中统计或者分组字段
哪些情况不需要创建索引1、表记录太少
2、经常增删改的表
3、如果某个数据列包含许多重复内容,为它建立索引就没有太大的实际效果