当MongoDB存储海量的数据时,一台机器可能不足以存储数据,也可能不足以提供可接受的读写吞吐量。这时,我们就可以通过在多台机器上分割数据,使得数据库系统能存储和处理更多的数据。
MongoDB 分片集群构成
- Shard:
用于存储实际的数据块,实际生产环境中一个shard server角色可由几台机器组个一个relica set承担,防止主机单点故障 - Config Server:
mongod实例,存储了整个 ClusterMetadata,其中包括 chunk信息。 - Query Routers:
前端路由,客户端由此接入,且让整个集群看上去像单一数据库,前端应用可以透明使用。
搭建MongoDB 分片集群
1. 端口分布一览表
Shard Server 1: 27020
Shard Server 2: 27021
Shard Server 3: 27022
Shard Server 4: 27023
Config Server : 27100
Route Process: 40000
启动Shard Server
mongodb_dir = '/home/guangqing.dgq/mongodb'
mkdir $mongodb_dir/shard
mkdir $mongodb_dir/shard/s1
mkdir $mongodb_dir/shard/s2
mkdir $mongodb_dir/shard/s3
mkdir $mongodb_dir/shard/s4
# 创建日志目录
mkdir $mongodb_dir/shard/log
# start up
$mongodb_dir/bin/mongod --port 27020 --dbpath=$mongodb_dir/shard/s1 --logpath=$mongodb_dir/shard/log/s1.log --logappend --fork
$mongodb_dir/bin/mongod --port 27021 --dbpath=$mongodb_dir/shard/s2 --logpath=$mongodb_dir/shard/log/s2.log --logappend --fork
$mongodb_dir/bin/mongod --port 27022 --dbpath=$mongodb_dir/shard/s3 --logpath=$mongodb_dir/shard/log/s3.log --logappend --fork
$mongodb_dir/bin/mongod --port 27023 --dbpath=$mongodb_dir/shard/s4 --logpath=$mongodb_dir/shard/log/s4.log --logappend --fork
启动Config Server
mongodb_dir='/home/guangqing.dgq/mongodb'
mkdir $mongodb_dir/shard/config
$mongodb_dir/bin/mongod --port 27100 --dbpath=$mongodb_dir/shard/config --logpath=$mongodb_dir/shard/log/config.log --logappend --fork
启动 Route Process
mongodb_dir='/home/guangqing.dgq/mongodb'
$mongodb_dir/bin/mongos --port 40000 --configdb localhost:27100 --fork --logpath=$mongodb_dir/shard/log/route.log --chunkSize 500
配置Sharding
使用MongoDB Shell登录到mongos,添加Shard节点
mongodb_dir='/home/guangqing.dgq/mongodb'
$mongodb_dir/bin/mongo admin --port 40000
# 在shell 下执行
db.runCommand({ addshard:"localhost:27020" })
db.runCommand({ addshard:"localhost:27021" })
db.runCommand({ addshard:"localhost:27022" })
db.runCommand({ addshard:"localhost:27023" })
# 集群已经建立,但是mongos不知道该如何切分数据,需要设置片键
# 1, 开启数据库分片功能,enablesharding()
db.runCommand({ enablesharding:"test" })
# 2, 指定集合中分片的片键。指定片键为log的id 和 time字段
db.runCommand({ shardcollection: "test.log", key: { id:1,time:1}})
配置完成后,程序代码内无需太大更改,直接按照连接普通的mongo数据库那样,将数据库连接接入接口40000
维护sharding
- 列出所有的 shard server
db.runCommand({listshards:1})
- 查看分片状态
db.printShardingStatus()