前言
静下心来写一篇介绍1NF、2NF、3NF与BCNF范式的文章。
整体关系
他们的约束如上图,也就是说:
- 满足1NF的约束一定满足2NF。
- 满足2NF的约束一定满足3NF。
- 满足3NF的约束一定满足BCNF范式。
从1NF说起
1NF是最宽松的范式,只要属性不可分割就满足1NF。什么是属性?属性就是表中的字段。也就是说,只要存在于数据库里表都满足1NF。那么什么样的表不满足1NF?比如这样一个关于客户信用卡交易的表:
因为我们不知道具体的用户、具体的信用卡信息、具体的交易信息,所以无法存入数据,为了满足1NF我们需要对其细化,如下:
我们细化了表属性,同时存入了一些数据。那么你发现有什么问题了吗?
细思极恐,你会发现这样一些问题:
- 数据冗余:
想一下,比如我们的用户Alan,如果有上百条他的交易信息,那么他的用户ID、用户姓名、办卡日期信息会造成大量冗余。
2.插入操作异常:
如果我们有一名新会员Joe办了卡,但是没有交易信息,那么在这个表里,我们应该怎么插入这条信息?答案是不能插。
3.更新操作复杂:
如果我们的用户姓名更改了,比如Alan名字改成了Joe,那么我们每条信息都必须要更改,是否有点愚蠢?
4.删除操作异常:
如果Alan这个用户卡注销了,我们必须把所有关于Alan的信息删除点,这很愚蠢。并且如果我们想把他的交易信息保留下来,是不能做到的。
所以,人们为了解决这些问题,对表有了更加严谨的约束。
2NF
2NF做了什么?他的改进是:
在1NF的基础上,消除了非主属性对于码的部分函数依赖。
这里有几个概念需要复习一下:
- 函数依赖
- 码
- 非主属性。
复习分根线
函数依赖
这是在范式中很重要的概念,也很好理解。简单,
知道A就能推出B,就称B对于A函数依赖,记做A→B。
比如本例中:
(用户ID)→(用户姓名)
即知道了用户ID 就知道了用户姓名,所以,用户姓名 对于 用户ID 函数依赖。
那么函数依赖有哪些类型呢?它有三种类型:
- 完全函数依赖
- 部分函数依赖
- 传递函数依赖。
完全函数依赖
在一张表中,若X→Y,且对于X的任何一个真子集X',X'→Y都不成立,那么称Y对于X完全依赖。
比如(用户ID) → (用户姓名),用户姓名对于用户ID就是完全函数依赖。
部分函数依赖
假如X→Y,但是Y不完全依赖于X,那么就称Y部分依赖于X。
比如本例的(用户ID,交易ID)→(交易日期,金额)就是部分函数依赖。因为(交易ID)→(交易日期,金额),所以(交易日期,金额)部分依赖于(用户ID)。
传递函数依赖
假如Z依赖于Y,Y依赖于X,那么就称Z传递依赖于X。
码
设 K 为某表中的一个属性或属性组,若除 K 之外的所有属性都完全函数依赖于 K(注意是完全),那么我们称 K 为候选码,简称为码。
比如本例中(用户ID,信用卡ID,交易ID)能推出所有属性,那么(用户ID,信用卡ID,交易ID)就是码。码就不细说了,不然篇幅较长。
非主属性
不是码的属性。
比如本例中 用户ID、 信用卡ID、交易ID是主属性,用户姓名、办卡日期、交易日期、金额是非主属性。
回到主线
终于可以接着讲2NF了,再读这句话,我们有了不一样的理解:
在1NF的基础上,消除了非主属性对于码的部分函数依赖。
我们列出所有的函数依赖:
- (用户ID,信用卡ID,交易ID)→(用户姓名,交易日期,金额)
- (用户ID)→(用户姓名)
- (交易ID)→(交易日期,金额)
发现存在(用户ID)→(用户姓名),(交易ID)→(交易日期,金额)的部分依赖,所以我们对表进行分解,如下:
分解后R1、R2、R3均不存在部分函数依赖,符合2NF。
3NF
例子举得不好,后面来补坑。。。