在上一篇文章《数据库概述与常见数据库介绍》提到了数据库排名以及常见数据库,那么在前十的数据库中有关数据库的描述:
1.Relational:关系型
2.Document:基于文档的
3.Key-value:基于键值对的
4.Search engine:基于搜索引擎的
一、关系型数据库(RDBMS)
1.实质
关系型数据库是最古老的数据库类型,RDBMS模型是把复杂的数据数据结构归结为简单的二元关系(即二维表格形式),以行(row)和列(column)的形式存储数据,这一系列的行和列内成为表(table),一组表就组成了一个库(database)
关系型数据库就是建立在关系模型基础上的数据库,SQL就是关系型数据库的查询语言
2.优势
- 复杂查询:可以用SQL语句方便在一个表以及多个表之间做非常复杂的数据查询
- 事务支持:使得对于安全性能很高的数据访问要求得以实现
二、非关系型数据库
1.介绍
非关系型数据库,可以看成传统关系型数据库功能的阉割版本,基于键值对存储数据,不需要经过SQL层的解析,性能非常高。同时通过减少不常用的功能,进一步提高性能
目前大部分主流的非关系数据库基本上都是免费的
2.NoSQL类型
相比于SQL,NoSQL泛指非关系型数据库,包括了榜单上的键值型、文档型、搜索引擎和列存储等,除此以外还包括图形数据库。也只有用NoSQL一词才能包括这些技术
2.1、键值对数据库
通过Key-Value键值的方式来存储数据,其中Key和Value可以是简单的对象,也可以是复杂的对象,Key作为唯一的标识符,优点是查找速度快,在这方面明显优于关系型数据库,缺点是无法像关系型数据库一样使用条件过滤(比如 WHERE),如果不知道数据在哪里,就需要遍历所有的键,消耗大量的计算
键值型数据库典型的使用场景是作为内存缓存。Redis是最流行的键值型数据库
2.2、文档型数据库
此类数据库可存放并获取文档,可以是XML、JSON等格式。在数据库中文档作为处理信息的基本单位,一个文档就相当于一条记录。文档数据库所存放的文档,就相当于键值对数据库所存放的"值".MongoDB是最流行的文档型数据库。此外,还有CouchDB等
2.3、搜索引擎数据库
应用在搜索引擎领域的数据存储形式,由于搜索引擎会爬取大量的数据,并以特定的格式进行存储,这样在检索的时候才能保证性能最优,核心原理是"倒排索引"
典型产品:Solr、Elaticsearch、Splunk等
2.4、列式数据库
是相对于行式存储的数据库,Oracle、MySQL、SQL Server等数据库都是采用的行式存储(Row-based),而列式数据库是将数据按照列存储到数据库中,这样做的好处是可以大量降低系统的I/O,适合于分布式文件系统,不足在于功能相对有限
典型产品:Hbase等
2.5、图形数据库
利用了图这种数据结构存储了实体之间的关系。图形数据库最典型的例子就是社交网络中人与人的关系,数据模型主要是以节点和边(关系)来实现,特点在于能高效的解决辅助的关系问题
典型产品:Neo4j、InfoGrid等
三、总结
NoSQL对SQL做出了很好的补充,实际开发中,某些需求并不㤇完整的关系型数据库功能,使用性能更高、成本更低的非关系型数据库更明智。比如:日志收集、排行榜、定时器等功能
即使NoSQ的分类很多,但SQL的比重更大,从排行榜看前5有4个是关系型数据库,所以掌握SQL是非常有必要的
四、关系型数据库设计规则
- 关系型数据库的典型结构就是数据表,这些数据表的组成都是结构化的(Structured)
- 将数据放到表中,表再放到库中
- 一个数据库中可以有多个表,每个表都有一个名字用来标识自己,表明具有唯一性
- 表具有一些特征,这些特征定义了数据在表中如何存储,类似Java和Python中"类"的设计
1.表、记录、字段
E-R(entity-relationship,实体-联系)模型中有三个主要概念:实体集、属性、联系集
- 一个实体集(class)对应于数据库中的一个表(table)
- 一个实体(instance)则对应于数据库表中的一行(row),也称为一条记录(record)
-
一个属性(attribute)对应于数据库表中的一列(column),也称为一个字段(field)
2.2、一对多关系(one-to-many)
常见实例场景:客户表和订单表,分类表和商品表,部门表和员工表
比如:
- 员工表:编号、姓名、...、所属部门
-
部门表:编号、名称、简介
建表原则:
在从表(多方)创建一个字段,字段作为外键指向主表(一方)的主键
2.3、多对多关系(many-to-many)
要表示多对多关系,必须创建第三个表,该表通常称为联接表,它将多对多关系划分为两个一对多关系,将这两个表的主键都插入到第三个表当中
比如:
- 图片信息表:图片id,大小,位置
- 图片标签表:标签id,标签名,简介
-
图片标签表:一张图片可以选多个标签,一个标签可以被多个图片选择
2.4、自我引用(Self reference)
在同一张表中,可以引用自己的字段
比如:员工表(员工编号、姓名、部门编号、主管编号)
员工编号可能也是下级员工的主管编号