说明
本规范适用于mysql 5.1或以上版本使用
数据库范式
- 第一范式(1NF)确保每列保持原子性
第一范式(1NF):数据库表的每一列都是不可分割的原子数据项,而不能是集合,数组,记录等非原子数据项。
<pre>
例如:
体重是每个学生的属性,在数据库设计的时候,不会将“体重”拆分成两个字段保存,所以建立一个“学生表”(学生ID、姓名、身高、体重);
</pre>
- 第二范式(2NF)确保表中的每列都和主键相关
满足第二范式(2NF)必须先满足第一范式(1NF),第二范式(2NF)要求实体的属性完全依赖于主关键字。如果存在不完全依赖,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。
<pre>
例如:
每个学生要选课(包含课程名、任课老师、学分),如果都放到“学生表”中,如果课程没学生选,那找不到课程的信息,如果学生没选
课,也找不到任何学生的信息,原因:
a. 课程、任课老师、学分 这三个信息 不是与主键“学生ID”相关,所以应该分离出来,形成“课程表”(课程ID、课程名、任课老师、学分),
b. 再通过一对多的方式关联起来;
</pre>
- 第三范式(3NF)确保每列都和主键列直接相关,而不是间接相关
满足第三范式(3NF)必须先满足第二范式(2NF),要求一个关系中不包含已在其它关系已包含的非主关键字信息.
<pre>
例如:仍然是上面的例子,每一行数据是:学生ID、姓名、身高、体重、课程ID
如果将“课程名”也放到记录中,则违反了第三范式,因为“课程名”已经包含在 学生ID与课程ID 的一对多关系中,在实际纪录中,“课程名”将会出现冗余。
</pre>
范式的使用
一般情况下要求数据库的设计符合以上三大范式,如果有特殊的需求,可以不满足或部分满足第3范式,但至少满足前面两个范式进行数据库设计。
- 范式的使用可以消除数据库的冗余,不必要的冗余除了导致存储空间浪费以外,也可能导致检索性能低下;
- 如果有违背范式的使用,需要在数据库设计文档中注明,方便开发人员做相应的开发(通常是数据一致性);
- 恰当的冗余可以提升检索性能,但一定要注意数据一致性和业务场景,如果可以选择,缓存应该首选考虑,而不是去冗余数据;
- 数据一致性的处理成本比想象要高
基本规范
校对编码
- 一般情况下,数据库和数据表 使用utf8_general_ci (mysql 5.5以上应该用utf8mb4)校对编码,注意 ci 是表示大小写不敏感,如果需要大小写敏感的,不使用带 ci 结尾的字符集;
- 字段的校对编码取决于具体的业务需求;
存储引擎
- 一般的业务数据,使用InnoDB存储引擎,不再使用MyISAM;
- 内存型数据使用 MEMORY存储引擎,注意内存空间配置;
类型
在满足业务需求的前提下,选择准确而且小的类型:
- 根据业务需求选择对应字段类型,比如人的年龄,应该使用 TINYINT,而不是 VARCHAR
- 根据业务需求设置最小有效范围(尽可能小),比如,年龄字段 就没有必要用 INT 保存,而是用 TINYINT
- 如果是正整数,则使用 无符号(UNSIGNED) 类型,比如:主键的自增字段
- 如果是非空的字段,设置一个合理默认的值,比如年龄设置默认值为 0
- 所有的字段和表,必须有注释,说明表和字段的含义
命名规范
- 命名可以由 小写字母、数字、下划线 组成,非特殊情况,不使用大写拼写;
- 使用英文拼写,不使用拼音拼写;
数据库和表命名
- 数据库名以一个或多个单词组成,用下划线进行分隔,单词数不超过2个,例如:wechat_feedback
- 数据库前缀,以数据库名的单词首字母+下划线 组成,例如 wechat_feedback 数据库的表前缀是 wf_
- 表名,以前缀+词组/单词组成,词组单词数不超过3个,单词之间不分隔,例如:wf_userinformation
字段名
- 字段前缀以表名(不含前缀)的单词首字母+下划线组成,例如,wf_userinformation 表的字段前缀是 ui_
- 字段名以 字段前缀+词组/单词组成,词组单词数不超过3个,单词之间不分隔,例如:wf_userinformation 表的姓名字段:ui_name
索引约束
- 根据查询需求建索引,而不是盲目地去建索引,每个索引都必须有对应的查询场景,否则不应该建这个索引;
- 越简单的数据类型越好,比如整型、日期型,尽量避免对字符型做索引,如果需要,则须慎重考虑(是否有替代方案);
- 越小的数据,数据越小,存储和内存开销越小,速度更快(对应“ 基本规范:类型”)
- 区分度越大的字段,索引效果越好(区分度,即查询出来的结果集的大小,区分度越大,查询出来的结果集越小,也就是更精确);
- 尽量避免NULL,应该指定列为NOT NULL,建议使用0、一个特殊的值或者一个空字符串代替。
最左前缀
InnoDB使用的B-Tree索引,在使用组合索引(多条件查询)的时候,索引的顺序很总要,要遵循的原则是:最左前缀原则
<pre>
最左前缀:在查询条件中,MySQL只能对索引最左边的前缀进行有效的查找。
举例:在索引 search_index(t1,t2)中
SELECT * FORM wf_userinformation WHERE t1 = 1 AND t2 =2 (可以使用到索引 search_index)
SELECT * FORM wf_userinformation WHERE t1 = 1 (可以使用到索引 search_index)
SELECT * FORM wf_userinformation WHERE t2 = 2 (不能用到 索引 search_index)
</pre>
- 数据库设计和不能仅仅自身设计,更应该考虑查询的场景(包括使用的查询字段和查询顺序)
- 在多条件查询(组合索引),应该通过小结果集驱动大结果集(即将区分度大的字段放在前面,区分度小的放在后面)
- 将索引的情况写入文档,方便后面开发人员的使用或调整
通过explain做优化
待补充...
2014/12