范式
范式:normal format ,是一种离散数学中的知识,是为了解决的存储与优化的问题。保证数据存储之后,凡是能够通过关系寻找出来的数据,坚决不能重复存储。终极目标是为了解决数据的冗余存储。
范式是一种分层结构的规范,分为6层,每一层比上一层麻烦。若要满足下一层范式,前提是要满足上一层范式。
六层范式:1NF 2NF 3NF ...6NF 1NF要求最低,6NF要求最高。
Mysql是关系型数据库,有空间浪费,为了节省空间,因此在设计数据库时,可以引用范式的思想设计数据库。一般情况只要求做到满足前三层范式的需求。
1NF 第一范式
在设计表存储数据的时候,如果表中存储的数据在取出使用之前,还需要做额外操作(拆分),则不满足第一范式要求,第一范式要求数据库表的字段(注意是字段)设计满足原子性(不可拆分)。
如某个字段把开始时间和结束时间放在一起,但是读取的时候只需要读取开始时间。这样就不满足第一范式,可以将开始时间和结束时间拆分为两个字段进行存储。
2NF 第二范式
在数据表设计过程中,如果有复合主键(多字段)且这个表中有字段并不是依赖整个主键而是依赖其中某部分主键,这种情况属于部分依赖,第二范式就是要解决部分依赖。即不允许出现部分依赖
以上表中,因为讲师没有办法作为独立主键,需要结合班级才能作为主键,但是性别字段依赖讲师,教室字段依赖于班级。这样构成了部分依赖,不符合第二范式。
解决方案一:可以将性别与讲师单独设成表,同时班级与教室单独成表。
解决方案二:取消复合主键,使用逻辑主键
3NF 第三范式
理论上,一张表中的所有字段都依赖于该表的主键。如果一张表中存在一个字段,并不直接依赖主键, 而是通过某个非主键依赖。这种非主键依赖称之为传递依赖。第三范式就是要解决传递依赖的问题。
上表中,性别依赖于讲师,教室依赖于班级。讲师和班级又依赖于主键。
不符合第三范式。
解决方案:
将存在传递依赖的字段以及依赖字段本身单独取出成表。然后在需要对应的表信息多的时候,使用对应的实体表的主键加进来。
逆规范化
有时候,某张表的几个字段需要从另外几个表中获取,多表联合查询会导致效率偏低,为了效率。我们会刻意不去保存该字段在另外表中的主键,而是直接保存想要的数据。这样就可以在一张表中完成查询,已达到提升效率的目的。但是就会有数据冗余