1、什么是分片
在Mongodb里面存在另一种集群,就是分片技术,可以满足MongoDB数据量大量增长的需求。当MongoDB存储海量的数据时,一台机器可能不足以存储数据,也可能不足以提供可接受的读写吞吐量。这时,我们就可以通过在多台机器上分割数据,使得数据库系统能存储和处理更多的数据。
2、架构
Config Server:存储集群所有节点、分片数据路由信息。默认需要配置3个Config Server节点。
Mongos:提供对外应用访问,所有操作均通过mongos执行。一般有多个mongos节点。数据迁移和数据自动平衡。
Mongod:存储应用数据记录。一般有多个Mongod节点,达到数据分片目的。可以是集群。
3、配置
执行命令 bash bash.sh
#创建db路径
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/db/db27001
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/db/db27002
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/db/db27003
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/db/db27011
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/db/db27012
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/db/db27013
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/db/db27021
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/db/db27022
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/db/db27023
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/db/db27031
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/db/db27032
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/db/db27033
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/db/db40000
#创建日志路径
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/logs/logs27001
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/logs/logs27002
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/logs/logs27003
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/logs/logs27011
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/logs/logs27012
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/logs/logs27013
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/logs/logs27021
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/logs/logs27022
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/logs/logs27023
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/logs/logs27031
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/logs/logs27032
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/logs/logs27033
mkdir -p /Users/fyh13/fyh13/mongodb/shard/data/logs/logs40000
#启动集群1
mongod --port 27011 --dbpath=/Users/fyh13/fyh13/mongodb/shard/data/db/db27011 --logpath=/Users/fyh13/fyh13/mongodb/shard/data/logs/logs27011/mongodb.log --fork --shardsvr --replSet=rs1
mongod --port 27012 --dbpath=/Users/fyh13/fyh13/mongodb/shard/data/db/db27012 --logpath=/Users/fyh13/fyh13/mongodb/shard/data/logs/logs27012/mongodb.log --fork --shardsvr --replSet=rs1
mongod --port 27013 --dbpath=/Users/fyh13/fyh13/mongodb/shard/data/db/db27013 --logpath=/Users/fyh13/fyh13/mongodb/shard/data/logs/logs27013/mongodb.log --fork --shardsvr --replSet=rs1
#启动集群2
mongod --port 27021 --dbpath=/Users/fyh13/fyh13/mongodb/shard/data/db/db27021 --logpath=/Users/fyh13/fyh13/mongodb/shard/data/logs/logs27021/mongodb.log --fork --shardsvr --replSet=rs2
mongod --port 27022 --dbpath=/Users/fyh13/fyh13/mongodb/shard/data/db/db27022 --logpath=/Users/fyh13/fyh13/mongodb/shard/data/logs/logs27022/mongodb.log --fork --shardsvr --replSet=rs2
mongod --port 27023 --dbpath=/Users/fyh13/fyh13/mongodb/shard/data/db/db27023 --logpath=/Users/fyh13/fyh13/mongodb/shard/data/logs/logs27023/mongodb.log --fork --shardsvr --replSet=rs2
#启动集群3
mongod --port 27031 --dbpath=/Users/fyh13/fyh13/mongodb/shard/data/db/db27031 --logpath=/Users/fyh13/fyh13/mongodb/shard/data/logs/logs27031/mongodb.log --fork --shardsvr --replSet=rs3
mongod --port 27032 --dbpath=/Users/fyh13/fyh13/mongodb/shard/data/db/db27032 --logpath=/Users/fyh13/fyh13/mongodb/shard/data/logs/logs27032/mongodb.log --fork --shardsvr --replSet=rs3
mongod --port 27033 --dbpath=/Users/fyh13/fyh13/mongodb/shard/data/db/db27033 --logpath=/Users/fyh13/fyh13/mongodb/shard/data/logs/logs27033/mongodb.log --fork --shardsvr --replSet=rs3
#启动配置服务器集群
mongod --port 27001 --dbpath=/Users/fyh13/fyh13/mongodb/shard/data/db/db27001 --logpath=/Users/fyh13/fyh13/mongodb/shard/data/logs/logs27001/mongodb.log --fork --configsvr --replSet=rs0
mongod --port 27002 --dbpath=/Users/fyh13/fyh13/mongodb/shard/data/db/db27002 --logpath=/Users/fyh13/fyh13/mongodb/shard/data/logs/logs27002/mongodb.log --fork --configsvr --replSet=rs0
mongod --port 27003 --dbpath=/Users/fyh13/fyh13/mongodb/shard/data/db/db27003 --logpath=/Users/fyh13/fyh13/mongodb/shard/data/logs/logs27003/mongodb.log --fork --configsvr --replSet=rs0
#配置集群
mongo localhost:27011
rs.initiate({_id: 'rs1', members: [{_id: 0, host: 'localhost:27011'}, {_id: 1, host: 'localhost:27012'},{_id: 2, host: 'localhost:27013'}]})
exit
mongo localhost:27021
rs.initiate({_id: 'rs2', members: [{_id: 0, host: 'localhost:27021'}, {_id: 1, host: 'localhost:27022'},{_id: 2, host: 'localhost:27023'}]})
exit
mongo localhost:27031
rs.initiate({_id: 'rs3', members: [{_id: 0, host: 'localhost:27031'}, {_id: 1, host: 'localhost:27032'},{_id: 2, host: 'localhost:27033'}]})
exit
mongo localhost:27001
rs.initiate({_id: 'rs0', members: [{_id: 0, host: 'localhost:27001'}, {_id: 1, host: 'localhost:27002'},{_id: 2, host: 'localhost:27003'}]})
exit
#启动路由服务器
mongos --port 40000 --configdb rs0/localhost:27001,localhost:27002,localhost:27003 --fork --logpath=/Users/fyh13/fyh13/mongodb/shard/data/logs/logs40000/mongodb.log --logappend
mongo localhost:40000
use admin
db.runCommand({ addshard: 'rs1/localhost:27011,localhost:27012,localhost:27013'})
db.runCommand({ addshard: 'rs2/localhost:27021,localhost:27022,localhost:27023'})
db.runCommand({ addshard: 'rs3/localhost:27031,localhost:27032,localhost:27033'})
db.runCommand({ enablesharding: 'order'})
db.runCommand({ shardcollection: 'order.orderAttr', key: {orderId: 1}})
sh.status()
#将分片key设置为索引
use order
db.orderAttr.ensureIndex({"orderId": 1})
4、sharding key
1)按照范围
用户可以指定根据集合内文档的某个字段即shard key来进行范围分片(range sharding)
2)hash
分片过程中利用哈希索引作为分片的单个键,且哈希分片的片键只能使用一个字段,而基于哈希片键最大的好处就是保证数据在各个节点分布基本均匀。
分片键注意事项:
分片键是不可变。
分片键必须有索引。
分片键大小限制512bytes。
分片键用于路由查询。
MongoDB不接受已进行collection级分片的collection上插入无分片
键的文档(也不支持空值插入)
5、客户端连接
mongos> use order
switched to db order
mongos> db.orderAttr.insert({orderId: "1234567", name: "大米"})
WriteResult({ "nInserted" : 1 })
mongos> db.orderAttr.findOne()
{
"_id" : ObjectId("5ae3f94d8460d77fd5ae2d4f"),
"orderId" : "1234567",
"name" : "大米"
}
分片过程中利用哈希索引作为分片的单个键,且哈希分片的片键只能使用一个字段,而基于哈希片键最大的好处就是保证数据在各个节点分布基本均匀。