DBS(Database System)
- 传统的文件处理系统中存储组织信息的主要弊端
- 数据的冗余和不一致性(data redundancy and inconsistency)
- 数据访问困难(dificulty in accessing data)
- 数据孤立(data isolation)
- 完整性问题(integrity problem)
- 原子性问题(atomicity problem)
- 并发访问异常(concurrent-access anomaly)
- 安全性问题(security problem)
- 数据库系统的目标:提供一种可以方便高效地存取数据库信息的途径
数据视图
数据库系统的一个主要目的是给用户提供数据的抽象视图,也就是说隐藏关于数据存储和维护的某些细节
-
数据抽象
- 物理层(physical level)
- 最低层次的抽象
- 描述了数据实际上是怎么存的(比如是都存在一个文件里还是分散在多个文件里)
- 逻辑层(logical level)
- 比物理层层次稍高的抽象
- 描述了数据库中存什么数据以及数据之间的关系
- 逻辑层的用户不需要去关系数据具体是怎么存的,这称作物理数据独立性(physical data independence)
ps: 对于具有物理数据独立性的设计,即便底层的物理存储改变了,逻辑层也不需要做任何的修改
- 视图层(view level)
- 最高层次的抽象,只描述整个数据库的某个部分
- 简而言之,对于逻辑层的数据,我们可以通过不同的视图,以不同的视角以及视野去查看它
- 物理层(physical level)
-
实例和模式
类比:模式类比于变量的声明,实例类比于变量在特定时刻的值
- 模式: 数据库的总体设计
- 数据库的模式限定了数据库中都有哪些表,表中都有哪些字段以及表与表之间的关系
- 实例: 特定时刻存储在数据库中的信息的集合
- 数据库的一个实例包含了数据库在一个时刻下的所有表的信息
-
数据模型
- 关系模型
- 实体—联系模型
- 基于对象的数据模型
- 半结构化的模型
- 网状数据模型
- 层次数据模型
关系型数据库的一些基本术语
- relation(关系)==>表
- column(列)==>字段(同一字段内所有数据的数据类型一致)
- row(行)==>对应于数据库表中的一行数据(对应于数学概念中的元组)
- SQL(Structured Query Language)==>结构化的查询语言
- DDL:Data Define Language(数据定义语言)==>执行 该类SQL语句会导致表结构的变化
- DML:Data Manager Language(数据操纵(管理)语言)==>执行该类SQL语句对表中的数据进行增删改查
- tuple(元组)==>对应于数据表中的一行数据
- domain(域)==>字段的取值范围
- schema(方案/模式)==>数据库中的Schema,为数据库对象的集合,一个用户一般对应一个schema
- Cartesian product(笛卡儿积)
ps: 应当避免表与表之间相关联的时候采用全匹配(如果采用笛卡尔积的匹配方式即为全匹配)
DDL (数据定义语言)
数据库模式定义语言DDL(Data Definition Language),是用于描述数据库中要存储的现实世界实体的语言。一个数据库模式包含该数据库中所有实体的描述定义。
- 执行此类语句会导致数据库结构的变化
- create(创建一个表)
-- 下面的语句创建了一个用户表,以id为主键,并添加了username和age字段
CREATE TABLE User(
id INT PRIMARY KEY AUTO_INCREMENT,
username VARCHAR(20) DEFAULT "",
age INT DEFAULT 18
);
CREATE UNIQUE INDEX User_id_uindex ON User (id);
- alter(修改表的结构)
-- 下面的语句修改了user表的id属性
ALTER TABLE user MODIFY id INT(11) unsigned NOT NULL AUTO_INCREMENT;
- drop(删除一张表)
-- 下面的语句删除了为user表
DROP TABLE demo.user;
-
rename(用于对一张表的名字进行重命名)
- Oracle数据库将其划分到DDL
- SQL server数据库将其归到DML
-- 下面的语句将user表的表名改成new_user
rename table user to new_user
- truncate(截断==>用于删除数据表中的所有数据,但是保留表结构,不同公司的数据库实现的机制不同)
DML
数据操纵语言(Data Manipulation Language, DML)是SQL语言中,负责对数据库对象运行数据访问工作的指令集,以INSERT、UPDATE、DELETE三种指令为核心,分别代表插入、更新与删除,是开发以数据为中心的应用程序必定会使用到的指令,因此有很多开发人员都把加上SQL的SELECT语句的四大指令以“CRUD”来称呼。
- 此类语句对数据进行增删改查(CRUD)
- insert
-- 下面的语句往user用户表中插入一条记录
INSERT into user(username, age) VALUES('Robbin', 18)
-- 下面的语句修改了user表中username为Robbin的表项(元组)的数据
UPDATE user SET username = 'Robbin2', age = 17 WHERE username = 'Robbin'
-- 下面的语句删除user表中username为Robbin2的表项(元组)
DROP FROM user WHERE username = 'Robbin2'
-
select
- DB2将select归到DML
- Oracle将select单独划为一类(因为select操作只是对数据库进行查询操作,没有实质改变数据库中的数据)
-- 下面的语句查询user表中的所有数据
SELECT * FROM user
DML和DDL的区别
- DML语句支持回滚,采用事务,可以保证数据的一致性;而DDL语句采用隐式commit,是不支持回滚的(一旦执行就不可撤回)
- 四种SQL语句
Key(键/码)
- superkey(超码)==>一个或多个字段的集合,可唯一标识一行数据
- candidate keys(候选码)==>最小的超码(即本集合为超码,且集合内除本身外的任何子集都不能作为超码)
- Primary key(主码/主键)==>从候选码中选取一个作为主码(主键),可以由多个字段组成
- Primary attribute(主属性)==>包含于某个候选码的属性
- Non-Prime attribute(非主属性)==>不包含于某个候选码的属性
Note:
- 数据表中字段的个数是有限的
- 属性在元组中是无序的(但是设计的时候一般把主键放在前面)
- 设计字段的时候要保证字段的原子性
- NULL==>空值表示不确定的值,不代表0,也不代表空串