第一范式:确保每列的原子性.
如果每列(或者每个属性)都是不可再分的最小数据单元(也称为最小的原子单元),则满足第一范式.
例如:顾客表(姓名、编号、地址、……)其中"地址"列还可以细分为国家、省、市、区等。需要拆分成两个表:
顾客表
姓名、编号、地址ID
地址表
主键、国家、省份、市区
第二范式:在第一范式的基础上更进一层,目标是确保表中的每列都和主键相关.
如果一个关系满足第一范式,并且除了主键以外的其它列,都依赖于该主键,则满足第二范式.
例如:订单表(订单编号、产品编号、定购日期、价格、……),"订单编号"为主键,"产品编号"和主键列没有直接的关系,即"产品编号"列不依赖于主键列,应删除该列。应该这样设计:
产品表
产品ID、产品名称、订单ID
订单表
主键、订单编号、定购日期、价格
第三范式:在第二范式的基础上更进一层,目标是确保非主键字段不能相互依赖
意思是除主键外,每列都与主键有直接关系,其他列相互之间不存在传递依赖
例如
学号、姓名、年龄、所在学院,、学院地点、学院电话,关键字为单一关键字"学号";
存在依赖传递: (学号) → (所在学院) → (学院地点, 学院电话)
说明:所在学院依赖学号(主键),而学院联系电话又依赖所在学院(非主键)
存在问题:
数据冗余:有重复值;
更新异常:有重复的冗余信息,修改时需要同时修改多条记录,否则会出现数据不一致的情况
修正:
学生:(学号, 姓名, 年龄, 所在学院);
学院:(学院, 地点, 电话)。