mysql-索引使用-列的散列度-01

mysql 查询优化中,索引的使用原则

  • 前提:sys_user 。数据340W
CREATE TABLE `sys_user` (
`id`  int(11) NOT NULL AUTO_INCREMENT ,
`user_name`  varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL COMMENT '用户名' ,
`user_password`  varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL COMMENT '用户密码' ,
`phone`  varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL COMMENT '电话号码' ,
`email`  varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL COMMENT '邮箱' ,
`address`  varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL COMMENT '地址' ,
PRIMARY KEY (`id`),
INDEX `idx_user_name` (`user_name`) USING BTREE 
)
ENGINE=InnoDB
DEFAULT CHARACTER SET=utf8 COLLATE=utf8_general_ci
AUTO_INCREMENT=3409377
ROW_FORMAT=DYNAMIC
;
  • 列的离散度
    在分析索引的使用之前,先看一个必要的概念:列的离散度。
  1. 计算公式:user_name 的离散度
select (select count(distinct(user_name)) from sys_user )/(select count(1) from sys_user);

从上面公式可以看出:列重复的值越少,离散度越高,重复的值越多离散度越低。这个和索引有啥关系?结论是:离散度越高,在查询时,扫描的行数越少,效率越高。原理后面分析,先看现象。

  1. 离散度测试

数据量 340W。

数据.PNG

如上图所示:email 的数据离散度非常低。也就是email 存中很多的重复的值。

  1. 在没有使用索引的前提下:查询
查询.png
SELECT user_name,email from sys_user where email = '1234@163.com'

运行结果是,需要2.9s,我们可以使用 explain 分析一下执行情况。

EXPLAIN SELECT user_name,email from sys_user where email = '1234@163.com'
扫描结果.png

从图中我们可以看到,在没有使用索引的情况下,查询条件是email 时,要扫描 310W 行的数据,几乎是全表扫描了,所以很慢,用了接近3s 的时间。

  1. 给email 创建索引

ok, 从上面的查询结果看,查询很慢,我们第一反应是创建一个索引,ok,现在我们就来创建一个索引。


索引查询.png

我们看到查询结果,结果明显只用于0.001s。那么是不是说明离散度的低的列建立索引也能对查询结果有明显的提高呢?先分析explain :


image.png

我们看到,这条语句执行只扫描了三行,所以查询很快。再看一条语句:


image.png

image.png

怎么回事?不是加了索引就会变快吗?怎么换个值查询,就又变慢了呢??原因就是扫描了150万行的数据。

  1. 多条件查询:
SELECT user_name,email, user_password from sys_user where email = '123@163.com' and user_password = '1234569'

查询结果:


查询结果.png

简直就是灾难,明明只有两条数据符合结果,但是却用了接近10s 。

explain结果.png

扫描数据库 157W行数据。

  • 结论:从上面的运行结果看,表中的email 列数据离散度非常低,也就是说重复度非常高,那么我们就算为email 创建了索引,效果也没有多么明显,也就是说,如果想通过索引来优化查询性能的话,创建索引的列的值的重复度必须要小。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 196,302评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,563评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,433评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,628评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,467评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,354评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,777评论 3 387
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,419评论 0 255
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,725评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,768评论 2 314
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,543评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,387评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,794评论 3 300
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,032评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,305评论 1 252
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,741评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,946评论 2 336