MySQl的分区与分表
1 分区的认识
1) 情景假设
假如有1000万条数据,放到一个表中会出现查询速度很慢的情况.但是如果我们将数据分散保存到10个表中,每一个表中100万数据,这是速度就会得到很大的提升!但是让我们手动分表,就会造成很大的麻烦.所以我们直接使用mysql的分区技术.
2) 分区的示意图
1 虽然内部分成了四个区,但是对外提供服务的依旧是一张表.
2 存到哪里以及从哪里取,这个时候就要使用mysql内部的分区算法.
3) 四种分区
具体为:
key hash ---->[求余方式]
range list ---->[范围方式]
其中 key和hash 与 业务联系不紧密,就是删除一个分区数据不会丢失.
range 和 list 与 业务联系紧密 ,删除分区之后,相应分区数据就会丢失.
注意:分表字段必须是主键 或 主键的一部分(复合主键索引的第二个字段)
2 key分区----取余
create table tableName (
字段.......
)engine=表引擎 partition by key (id) partitions num;
注意:这里的分区不区别表的引擎是innodb和myisam.
a 新建一个sql表实现分区,分区字段一定是主键
b 查看分区的文件
以key算法分区 ,参数是id,分10个区(也就意味着有是个文件)
Partition by 分区算法 (参数) 分区选项。
c 随机插入数据进行测试
执行刷新一次,才能重新将数据写入到data中
flush tables;
d插入数据之后,查看保存数据的文件
注意:这里数据插入之后自动分成两个文件.
算法key是内部指定的,到底什么数据,放在哪一个分区中我们没有办法操作,肯能导致数据分配的不均匀.
3 hash分区
HASH分区主要用来确保数据在预先确定数目的分区中平均分布,要做的只是基于将要被哈希的列值指定一个列值或表达式,以 及指定被分区的表将要被分割成的分区数量。hash分区所使用的字段一定要是主键!!
hash语法:
create table 表名(
.........
)engine=MyISAM partition by hash(算法函数)) partitions 分区的数量;
a 新建一个学生表,让学生信息,根据月份进行存储
create table hash_1(
id mediumint unsigned auto_increment not null,
birthday date,
primary key (id,birthday)
)engine=MyISAM partition by hash(month(birthday)) partitions 12;
解释:
month()提取日期中的月份
hash(month(birthday)) 按照日期中的月份进行分区
b 查看分区之后的数据文件
c 插入几条数据进行测试:
insert into hash_1 values(null,'1992-05-20');
insert into hash_1 values(null,'1993-06-20');
insert into hash_1 values(null,'1993-07-20');
insert into hash_1 values(null,'1993-10-20');
#注意这里的月份,不同的月份会放到不同数据文件
d 插入数据之后,查看文件的变化
注意:分区字段一定是主键
1 这里的month()函数是返回日期中的月份值
2 注意这里的hash()设置的值, 可以是相关的函数也可以是一个字段,不过一定要是一个整数.