一、概述
文档数据库是一种“最像关系数据库的NoSQL”,MongoDB是典型的文档数据库产品。
MongoDB是由C++编写的基于分布式文件存储的开源数据库系统。很多公司用,因为它免费……
MongoDB旨在为Web应用提供可扩展的高性能数据存储解决方案,因此流行于互联网企业。
二、特点
1. 面向文档存储
MongoDB提供面向文档的存储,操作简单。
MongoDB数据结构为键值对(key->value),数据被存储为一个二进制格式的JSON文档,称为BSON(Binary+JSON)。其文档格式类似JSON对象
2. 可建立任何属性的索引
文档数据库MongoDB虽然也是键值对数据结构,却可以针对各种不同的属性建立索引,可以实现更快的查询——这与真正的键值数据库不同(只能通过键查询,不能对值建立索引)。
3. 良好的水平扩展性
在高负载下可以添加更多节点以保证服务能力。
4. 丰富的查询表达式
可以查询文档中内嵌的对象和数组。
5. 支持修改
可以替换已经完成文档中某个指定的数据字段。
6. 支持MapReduce
MongoDB中使用MapReduce,通常是数据的批量处理和聚合操作。比如可以使用MapReduce实现类似关系数据库的Group by操作。
三、与关系数据库对比
1. 术语
前面提到MongoDB很像关系数据库,它们的术语也有很强的对应关系
SQL术语/概念 | MongoDB术语/概念 | 解释/说明 |
---|---|---|
database | database | 数据库 |
Mysqld/Oracle | mongod | 数据库服务端 |
mysql/sqlplus | mongo | 数据库客户端 |
table | collection | 数据库表/集合 |
row | document | 数据记录行/文档 |
column | field | 数据字段/域 |
index | index | 索引 |
table | joins | 表连接,MongoDB不支持 |
primary key | primary key | 主键,MongoDB自动将_id字段设置为主键 |
2. 单表示例
比如一个关系数据库的两行数据如下
id | user_name | age | city | |
---|---|---|---|---|
1 | Mark Hanks | mark@abc.com | 25 | Los Angeles |
2 | Richard Peter | richard@abc.com | 31 | Dallas |
写入MongoDB就是
{
"_id": ObjectId("5146bb52d8524270060001f3"),
"age": 25,
"city": "Los Angeles",
"email": "mark@abc.com",
"user_name": "Mark Hanks "
}
{
"_id": ObjectId("5146bb52d8524270060001f2"),
"age": 31,
"city": "Dallas",
"email": "richard@abc.com",
"user_name": "Richard Peter "
}
3. 多表示例
比如用传统关系数据库来记录博客信息(包含文章内容、评论、评论的投票),常设计为把信息记录到多个表内。然后通过主键外键关联来进行多表连接查询,以得到所需信息。
这是因为传统关系数据库是从减少冗余的角度来设计的。
使用MongoDB则会把每条记录都存储到文档的完整一段里。比如上面"Ada"评论了"Good post"给Jane的文章"MyFirstPost"
{
"id":1,
"author":"Jane",
"blogposts":
{
"tile":"MyFirstPost","comment":
{
"by":"Ada","text":"Good post"
}
}
}
查找某个数据(比如某人的评论),不需要跨表连接,所以易用性和并发性高。
四、数据库
一个MongoDB中可以建立多个数据库。默认数据库为"db",存储在data目录中。
每次安装MongoDB即生成一个实例(与SQL Server类似),单个实例可以容纳多个独立的数据库,每一个都有自己的集合和权限,不同的数据库也放置在不同的文件中。
五、集合
MongoDB的集合可以理解为文档组,一个集合相当于RDBMS的一个表格,每个文档相当于表格的一行。不同于关系数据库表格,集合没有固定结构,里面各个文档的数据格式和类型也不必一致。