开启MongoDB之路
因为python 爬虫和网站的需要,数据库必不可少。但是,mysql真的让我非常的困惑,尤其是多表连接和外键这种,简直反人类。后来看到现在越来越流行的NOSQL大行其道,打算从其中的佼佼者MongoDB开始研究起来
1 教程
工欲善其事必先利其器,找到了一个比较具体的教程
sh-3.2# mongod
2016-12-05T14:59:13.513+0800 I CONTROL [initandlisten] MongoDB starting : pid=51387 port=27017 dbpath=/data/db 64-bit host=BAYAO-M-F18A
...
BAYAO-M-F18A:~ bayao$ mongo
MongoDB shell version: 3.2.7
...
//这里有一个细节,需要一个窗口运行mongod启动sever,另一个窗口运行mongo链接server
MongoDB是面向文档的(document-oriented) 数据库系统 ( NoSQL的一种) ,其层级关系为:
database > collection > document > field > key:value.
交互命令
显示
> show dbs
bands 0.203125GB
movies (empty)
scores (empty)
选中一个数据库
> use movies
switched to db movies
查看当前使用的数据库
> db.getName()
movies
要 delete / drop 一个数据库, 确保你已选中一个数据库,然后执行操作:
> use scores
> db.dropDatabase()
{"dropped" : "scores", "ok" : 1 }
查看一个数据库中的collections(集合):
> show collections
创建一个Collection
db.createCollection('movie')
MongoDB 中的数据库都是懒创建的(需要时创建), 你不必显式的创建数据库。系统会根据你的命令在需要时创建数据库。要创建数据库,首先使用 use 命令切换到新数据库(要创建的数据库),然后保存一些数据在该数据库中——最后新数据库就被创建了。
> use movies
switched to db movies
> db.comedy.insert({name:"Bill & Ted's Excellent Adventure", year:1989})
上面的命令创建了 "movies"数据库,在这个过程中一个名为 "comedy" 的collection 也被创建在该数据库中。
处理 MongoDB 中的数据
详解CRUD (Create, Read, Update, Delete)
注意: 所有数据操作命令都在通过名为db的 MongoDB 数据库对象上进行 。 db 指向 use 命令选择的数据库。
添加数据
在 collection中创建documents:
> db.comedy.insert({name:"Wayne's World", year:1992})
> db.comedy.insert({name:'The School of Rock', year:2003})
上面两个命令为"movies" 数据库中名"comedy"的集合中添加了两个documents。
我们也可以使用 save进行相同的操作:
> db.comedy.save({name:"Wayne's World", year:1992})
> db.comedy.save({name:'The School of Rock', year:2003})
insert和 save的区别在于:
insert总是添加一个新的 document。如果接收的对象包含 _id,save执行update操作,否则执行insert操作。
我个人看来 save的存在没多大用处。建议添加新documents时使用 insert
操作,, 更新documents时使用 update操作。
读取数据
要读取数据:
> db.comedy.find()
{ "_id" : ObjectId("4e9ebb318c02b838880ef412"), "name" : "Bill & Ted's Excellent Adventure", "year" : 1989 }
{ "_id" : ObjectId("4e9ebb478c02b838880ef413"), "name" : "Wayne's World", "year" : 1992 }
{ "_id" : ObjectId("4e9ebd5d8c02b838880ef414"), "name" : "The School of Rock", "year" : 2003 }
上述操作将返回collection中的所有数据, 可以限制为两个:
> db.comedy.find().limit(2)
{ "_id" : ObjectId("4e9ebb318c02b838880ef412"), "name" : "Bill & Ted's Excellent Adventure", "year" : 1989 }
{ "_id" : ObjectId("4e9ebb478c02b838880ef413"), "name" : "Wayne's World", "year" : 1992 }
和 find().limit(1)类似, 使用 findOne(),将只返回一个结果:
db.comedy.findOne()
{"_id" : ObjectId("4e9ebb318c02b838880ef412"),"name" : "Bill & Ted's Excellent Adventure","year" : 1989}
如果要根据条件查找文档:
> db.comedy.find({year:{$lt:1994}})
{ "_id" : ObjectId("4e9ebb318c02b838880ef412"), "name" : "Bill & Ted's Excellent Adventure", "year" : 1989 }
{ "_id" : ObjectId("4e9ebb478c02b838880ef413"), "name" : "Wayne's World", "year" : 1992 }
上面的例子用来查找year字段小于1994的文档。$lt
是 MongoDB提供的众多条件操作符中的一个。下面再列出一些:
$lt - ' < '
$ne - '!='
$in - 'is in array'
$nin - '! in array'
怎么进行等于查询呢? 很简单:
> db.comedy.find({year:1992})
{ "_id" : ObjectId("4e9ebb478c02b838880ef413"), "name" : "Wayne's World", "year" : 1992 }
我们甚至可以使用正则表达式进行查询:
> db.comedy.find({name:{$regex: /bill|steve/i}})
{ "_id" : ObjectId("4e9ebb318c02b838880ef412"), "name" : "Bill & Ted's Excellent Adventure" }
一个使用 regex 更复杂的查询:
> var names = ['bill', 'steve']
> names = names.join('|');
> var re = new RegExp(names, 'i')
> db.comedy.find({name:{$regex: re}})
{ "_id" : ObjectId("4e9ebb318c02b838880ef412"), "name" : "Bill & Ted's Excellent Adventure" }
如何让指定的列出现在结果集中?
> db.comedy.find({year:{'$lt':1994}}, {name:true})
{ "_id" : ObjectId("4e9ebb318c02b838880ef412"), "name" : "Bill & Ted's Excellent Adventure" }
{ "_id" : ObjectId("4e9ebb478c02b838880ef413"), "name" : "Wayne's World" }
以上示例中,我们通过指定find()第二个参数来获取需要的field 。要获取多个字段,则像这样做:db.comedy.find({year:{'$lt':1994}}, {name:true, director:true})
. 因为没有设定director字段,所以结果集中看不到director信息。
_id
默认总是被返回。如果不想要该字段, 必须像下面解释的那样显式地设置。
显式的排除一些字段:
> db.comedy.find({year:{'$lt':1994}}, {name:false})
{ "_id" : ObjectId("4ed201525bfc796ab22f9ee1"), "year" : 1989 }
{ "_id" : ObjectId("4ed201605bfc796ab22f9ee2"), "year" : 1992 }
糟糕的是,在写本文时, 字段包含和排除不能同时使用。
我想展示一下Mongodb特有的查询 (使用 dot notation),我们首先在articles集合中添加一些数据:
> db.articles.insert({title:'The Amazingness of MongoDB', meta:{author:'Mike Vallely', date:1321958582668, likes:23, tags:['mongo', 'amazing', 'mongodb']}, comments:[{by:'Steve', text:'Amazing article'}, {by:'Dave', text:'Thanks a ton!'}]})
> db.articles.insert({title:'Mongo Business', meta:{author:'Chad Muska', date:1321958576231, likes:10, tags:['mongodb', 'business', 'mongo']}, comments:[{by:'Taylor', text:'First!'}, {by:'Rob', text:'I like it'}]})
> db.articles.insert({title:'MongoDB in Mongolia', meta:{author:'Ghenghiz Khan', date:1321958598538, likes:75, tags:['mongo', 'mongolia', 'ghenghiz']}, comments:[{by:'Alex', text:'Dude, it rocks'}, {by:'Steve', text:'The best article ever!'}]})
要查询嵌套对象,使用常规的JavaScript点操作即可。 例如,要查询 meta.likes
对象:
> db.articles.find({'meta.author':'Chad Muska'})
> db.articles.find({'meta.likes':{$gt:10}})
要查询一个数组:
> db.articles.find({'meta.tags':'mongolia'})
当要查询的 key 是一个 array,数据库将查询含有给定value的array。
要查询数组中的对象:
> db.articles.find({'comments.by':'Steve'})
甚至能够根据索引查询:
> db.articles.find({'comments.0.by':'Steve'})
多么神奇!
Because of the fact that array objects can be matched using the dot notation, it can be problematic if the objects in an array share the same keys but different values. In such cases, we need to use the $elemMatch
operator. To see an example and understand the issue better, read this.
引号包裹的数字是字符串:
> db.students.find({score:100})
上面代码与下面的截然不同:
> db.students.find({score:'100'})
通常,表单请求参数是以字符串形式呈献,如果你需要使用数字,请做必要的转换:
var score = +params.score;
params.score是String类型,但 score是JavaScript number类型, 可以在MongoDB查询中安全的使用。
MongoDB 查询支持 JavaScript 表达式! 看示例:
> db.comedy.find('this.year > 1990 && this.name != "The School of Rock"')
和下面结果的效果相同:
> db.comedy.find({year:{$gt:1990}, name:{$ne:'The School of Rock'}})
JavaScript 表达式的灵活是需要代价的 ——它要慢于本地化的 MongoDB 操作符。
MongoDB 有个叫 $where的操作符,用来类似于 SQL 的where查询。
> db.comedy.find({$where: 'this.year > 2000'})
{ "_id" : ObjectId("4ed45fae2274c776f9179f89"), "name" : "The School of Rock", "year" : 2003 }
以及
> db.comedy.find({name:'The School of Rock', $where: 'this.year > 2000'})
{ "_id" : ObjectId("4ed45fae2274c776f9179f89"), "name" : "The School of Rock", "year" : 2003 }
类似于 JavaScript 表达式, $where比其它本地操作符要慢。 只有在使用本地操作符无法满足查询的时候才考虑用 $where。
建议读完本文后,再通读MongoDB官方的 advanced MongoDB query operators 。
更新数据
让我们为documents添加一个新的字段。 你可能首先会想到这样:
> db.comedy.update({name:"Bill & Ted's Excellent Adventure"}, {director:'Stephen Herek'})
悠着点!那会产生灾难性的后果。上面的操作会将所有documents更新为{director:'Stephen Herek'}, 而不是添加一个新字段。
正确的做法是:
> db.comedy.update({name:"Bill & Ted's Excellent Adventure"}, {'$set':{director:'Stephen Herek', cast:['Keanu Reeves', 'Alex Winter']}})
上面的命令重设了字段,但被更新数据仍然是安全和完整的。
如果更新数组的值呢?
> db.comedy.update({name:"Bill & Ted's Excellent Adventure"}, {'$push':{cast:'George Carlin'}})> db.comedy.update({name:"Bill & Ted's Excellent Adventure"}, {'$push':{cast:'Chuck Norris'}})
如果需要移除数组中的值呢?这样做:
db.comedy.update({name:"Bill & Ted's Excellent Adventure"}, {'$pull':{cast:'Chuck Norris'}})
So easy! 关于更新,还有很多要学习的, click here。
删除数据
删除document中的字段:
> db.comedy.update({name:'Hulk'}, {$unset:{cast:1}})
删除collection中多个documents的字段:
> db.comedy.update({$unset:{cast:1}}, false, true)
false参数用来定义 upsert 选项, true用来定义进行多document更新。
删除具有指定键值对的文档:
> db.comedy.remove({name:'Hulk'})
置空一个collection:
> db.comedy.remove()
注意,它不是delete操作,类似于 SQLtruncate命令。
如果要delete?这样:
> db.comedy.drop()
要删除数据库,先选取,再执行 db.dropDatabase():
> use movies> db.dropDatabase(){"dropped" : "movies", "ok" : 1 }
查询文档数量
任何设计良好的数据库系统都应该提供一个 count()
方法,用以返回查询结集中的对象数量。 MongoDB 也不例外。
查询 comedy
集合中的documents的数量:
> db.comedy.count({})
查询 comedy 集合中 year大于1990的documents数量:
> db.comedy.count({year:{$gt:1990})