一、MongoDB 权威指南
亲身经历了在快速发展的大型互联网公司应于MySQL的过程。开始
时只有很少的数据,一台服务器就可以了。然后就得建立备份,以便应对大量
的读取和不时的当季。用不了多久,就得加一个缓存层,调整所有的查询。
投入更多的硬件。
MongoDB是是一款强大、灵活、且易于扩展的通用性数据库。它能扩展出
非常多的功能,如二级索引, 范围查询,排序,聚合,以及地理空间索引
纵向扩展就是适用计算能力更强的机器,而横向扩展就是通过分区将
数据分散到更多的机器上。通常,纵向扩展是最省力的做法,其缺点是大型机
一般都非常昂贵。而且,当数据量达到机器的物理极限时,无论话多少钱也买不到
更强的机器了。
另一个选择是横向扩展;要增加存储空间或提高性能,只需购买一台普通的服务器
并把它添加到集群中就可以了。
横向扩展的缺点就是,维护一个1000个集群的机器,比一个维护一个机器更麻烦。
二、为什么MongoDB 更易于横向扩展呢?
因为MongoDB 的主键不是自增的,所以不会有自增时候的限制。
并且使用类似UUID的方式,更加适用于分布式存储
这里需要研究下UUID的存储
三、MongoDB 提供一个卓越的性能。
MongoDB的一个主要目标是提供卓越的性能。这很大成都上决定了MongoDB的设计。
MongoDB能对文档进行动态填充(dynamic padding),也能预分配数据文件以利用
额外的空间来换取稳定的性能。MongoDB把竟可能多的内存做缓存(cache),
试图在各方面都保持他的卓越性能。
四、MongoDB 不提供
MongoDB 不提供连接(join)和复杂的多行事务(multirow trasaction).
省略这些功能是出于架构上的考虑,因为在分布式系统中这两个功能难以高效的实现
五、MongoDB 存储的特点
文档的键是字符串。
键不能含有\0(空字符串)。这个字符用于表示键的结尾
.和$具有特殊意义
MongoDB 的文档不能有重复的键。下面的文档就是非法的
{ "greeting": "Hello, world!", "greeting": "Hello, MongoDB!" }
- 文档中的键/值对是有序的
{ "x": 1, "y": 2 } 与 { "y": 2, "x": 1 } 是不同的
六、MySQL 与 MongoDB 的映射
MySQL MongoDB
db(tables) db(collections)
table collection
record document
七、动态模式
集合是动态的。这意味着一个集合里面的文档可以是各种各样的。
例如,下面两个文档可以存储在同一个集合里面
{ "greeting": "Hello, world!" }
{ "foo" : 5 }
但还是有必要设计多个集合
查询简单。
磁盘寻道操作更少。
创建索引,使用文档的附加结构。一个集合中只放入一种类型的文档,可以更有效地
对集合进行索引。
八、命名
集合不能出现以下情况
1、不能为空字符串
2、不能包含\0字符
3、不能以system.开头
4、不能包含$
九、子集合
组织集合的一种惯例是使用“.”分隔不同命名空间的自己合。
例如,一个具有博客功能的应用可能包含两个集合,分别是
blog.posts 和 blog.authors 这是为了使组织结构更加清晰。
这里的blog集合(这个集合甚至不需要存在)跟它的子集合
没有任何关系
十、数据库命名限制
- 不能是空字符串。
- 不能还有特殊符号, 可以使用- 或 _。数字或字母。
- 区分大小写。
- 最多64位。
如果要使用cms数据库中的blog.posts集合,这个结合的命名空间
就是cms.blog.posts。命名空间的长度不得超过121个字节
十一、MongoDB 启动
使用 mongod 启动
mongod 在没有参数的情况下会适用默认数据目录/data/db。
如果数据目录不存在或者不可写,服务器会启动失败。
MongoDB 监听27017 端口。
MongoDB还会启动一个非常基本的HTTP服务器,监听数字比主
端口号高1000的端口,也就是28017 端口。这意味着,通过浏览器
访问http://localhost:28017 能获取数据库的管理信息。
十二、MongoDB shell简介
MongoDB 自带JavaScript shell, 可在shell中适用命令行
能运行任意JavaScript程序。
十三、MongoDB 的CRUD
- 创建
> post = {
"title" : "My Blog Post",
"content" : "Here1s my blog post",
"date" : new Date()
}
db.blog.insert(post)
- 查询
> db.blog.find()
or
> db.blog.findOne()
- 更新
> post.comments = []
> db.blog.update({ title : "My Blog Post"}, post)
- 删除
使用remove 方法可将文档从数据库中永远删除。
如果没有使用任何参数,它将集合内的所有文档全部删除。
它可以接受一个作为限定条件的文档作为参数。
> db.blog.remove({title: "My Blog Post"})
十四、数据类型
- null
{ "x" : null }
- 布尔型
{ "x" : true }
- 数值
{ "x" : 3.14 }
{ "x" : NumberInt("3")}
{ "x" : NumberLong("3") }
- 字符串
{ "x" : "foobar" }
- 日期
毫秒数
{ "x" : new Date() }
- 正则表达式
{ "x" : /foobar/i }
- 数组
{ "x": ["a", "b", "c"]}
- 内嵌文档
{"x": {"foo" : "bar"}}
- _id
{ "x" : ObjecteId() }
- 二进制数据
所以可以存储任何的文件
- 甚至代码
{ "x" : function() { /* ... */ } }
参考 《MongoDB 权威指南》