【声明】本文章来自穆晨 - 博客园,记录于此方便后期的学习和查阅
一、前言
ER建模环节完成后,需求就被描述成了ER图。之后,便可根据这个ER图设计相应的关系表了。
从ER图到具体关系表的建立,需要经过两个步骤:逻辑模型设计和物理模型设计。其中前者将ER图映射为逻辑意义上的关系表,后者则映射为物理意义上的关系表。
逻辑意义上的关系表,可以理解为单纯意义上的关系表,它不涉及到表中字段数据类型,索引信息,触发器等细节信息。本文将详细介绍ER模型到逻辑关系表的映射是如何完成的。
二、基本概念
1. 关系(relation)
关系就是在数据库中存在的,包含行和列的一张表。也常被称为关系表,或者表。注意只有在确保不会引起混乱的时候使用最后一种称呼,因为关系表和一般意义上的表有很大区别(下文会分析)。
2. 列(column)
列就是字面意义上表的列,有时也被称作属性,或者域。
3. 行(row)
行就是字面意义上表的行,有时也被称作元祖,或者记录。
4. 关系表的基本约束(关系表 VS 一般的表)
- 一个列只能有一个名称
- 不能出现完全一样的行
- 表中每个值都必须为单值
- 同一列中的所有值都必须属于同一个域
- 行/列顺序无关
5. 主码(primary key)
每个关系表必须要有一个主码(可含多列),用来唯一标识表中各行记录。
6. 实体完整性约束(entity integrity constraint)
所有主码必须非空。
7. 外码(foreign key)
外码是关系表中的某一列,而这一列恰恰又是另一个关系表的主码。
8. 参照完整性约束(reference integrity constraints)
外码取值要么为空,要么为其参照关系表中的主码取值。
二、ER模型到关系表的映射
1. 常规实体映射为关系表
对常规实体来说,其每个属性对应到关系表中的某一列,而某单值且唯一的列则映射为主码,标记下划线。
-
如下实体:
-
映射为关系表:
2. 含复合属性的实体映射为关系表
在这类映射中,复合属性的各子属性会映射到新的关系中,且不会出现复合属性名。但数据库上层的前端应用,可能会用到复合属性名,也就是ER图在各个阶段都有可能用到,不是说映射为关系后就没啥事了。
-
如下实体:
-
映射为关系表:
3. 含唯一复合属性的实体映射为关系表
在这类映射中,会形成一个复合主码,其成员为复合属性的各子属性。
-
如下实体:
-
映射为关系表:
4. 含可选属性的实体映射为关系表
在这类映射中,需要将可选属性对应的列标记一个(O)。
-
如下实体:
-
映射为关系表:
5. 一对多(1 : M)联系的映射
在这类映射中,为M侧的实体所映射得到的关系中,设置一个外码,这个外码对应于由1侧的实体映射得到的关系中的主码。注意,外码命名不一定要和它对应的主码一致,可根据实际情况决定。
-
如下实体:
-
映射为关系表:
6. 多对多(M : N)联系映射
在这类映射中,除了具有多对多联系的两个实体之外,联系本身也需要映射为关系。联系对应的关系中将有两个外码,分别对应两个实体的主码,同时这两个外码构成新关系的主码。
-
如下实体:
-
映射为关系表:
7. 一对一(1 : 1)联系的映射
这类映射和 (1 : M) 很相似。原则上外键设在任何一个实体的关系中都OK,但如果一对一联系中的基数约束是强制单个和可选单个这种类型,则最好将外键设置在可选多的一侧。因为这样可以保证关系中不会出现太多空值。
-
如下实体:
-
映射为关表:
8. 含若干候选码的实体映射为关系表
在这类映射中,主码依然标记划线,而非主码唯一属性则标记(U)。
-
如下实体:
-
映射为关系表:
9. 含多值属性的实体映射为关系表
在这类映射中,需要为多值属性创建一个新的关系,新关系中包含一个外码,对应到主实体的主码。同时属性值和外码构成了新关系的复合主码。
-
如下实体:
-
映射为关系表:
10. 含派生属性的实体映射为关系表
派生属性不需要做什么特别处理,那是前端的事情,哈哈。
11. 一对多 (1 : M) 一元联系的映射
在这类映射中,实体映射得到的关系中包含一个外码,对应到关系自身的主码。需要注意的是,该映射中的外码名和主码名是不同的,事实上关系中也不允许出现名称相同的两列。
-
如下实体:
-
映射为关系表:
12. 多对多 (M : N) 一元联系的映射
在这类映射中,除了实体本身需要映射为关系之外,多对多联系也需要映射为另一个关系。新的关系中将有两个外码,它们均对应到实体主码。这两个外码又组合为新关系的复合主码,这里同样要注意外码名要避免和主码名重复。
-
如下实体:
-
映射为关系表:
13. 一对一 (1 : 1) 一元联系的映射
和上面第11条讲的一对多(1 : M)一元联系映射规则完全相同,此处不再举例说明。
14. 弱实体映射为关系
弱实体映射和常规一对多联系映射一样,需要在弱实体(M侧实体)中建立一个对应到属主实体(1侧实体)的外码。然而区别是弱实体中的主码是弱实体自身的部分码 + 外码构成的复合主码,而后者的主码仅是M侧实体自己的主码。
-
如下实体:
-
映射为关系表:
如果联系是一对一,则弱实体的主码就是那个对应到其属主实体的外码,而没有部分码了。
-
如下实体:
-
映射为关系表:
15. 将关联实体映射为关系
关联实体本身就是联系,因此它的映射规则和联系是一样的。
16. 三元联系的映射
在这类映射中,与多对多联系的映射比较相似。另外,三元联系肯定是多对多对多的。因为如果三元中有一个为一,那么该三元联系,就应该转成两个二元的一对多联系。
-
如下实体:
-
映射为关系表:
三、概念模型 VS 逻辑模型
数据开发人员绘制ER图,并和项目各方人员协同需求,达成一致的过程,叫做概念模型建模、或ER建模、或需求可视化。
概念模型建模过程中,涉及到的人员,开发能力比较薄弱,甚至不懂开发,因此ER图必须清晰明了,不能涉及到过多的技术细节。
在ER图绘制完毕之后,开始将它映射为数据库的各种关系表的过程,叫做逻辑模型建模,或者关系建模。
可能您会有疑问,ER图不是可以直接映射到关系吗,而且已经有了相应的映射工具了,为什么还要绘制ER图多此一举呢?ER图是拿出去和别人谈需求的,要求各方人员都能看得懂。而关系表涉及到了过多实现细节,比如:要给多对多联系/多值属性等多建一张表、要设置外码、各种复合主码等。这些东西不应该在谈需求的时候出现,它们应当对非开发人员透明。而且ER图中每个属性只会出现一次,减少了蕴含的信息量,是更好的交流和文档化工具。
其实,ER模型所蕴含的信息,也没有全部被逻辑模型包含。比如:联系的自定义基数约束、实体的复合属性和派生属性、用户的自定义约束等。因此ER模型,在整个开发流程(如物理模型建模,甚至前端开发)中是都会用到的,不能认为ER模型转换到逻辑模型后,就没有任何作用了。
逻辑模型设计好后,就可以开始着手数据库的物理实现了。数据库的物理实现也被称为物理模型建模,这个阶段不但需要参照逻辑模型,还应当参照ER图。