简介
Redis是一个开源的高性能键值对数据库,基于内存且可持久化的日志,所以通常也说内存数据库,提供多种键值数据类型能够适应不同的存储需求,所以这两块构成了Redis强大的基础,基于内存的高性能和支持多种数据类型的高可用。
可执行文件
- redis-server:Redis服务器
- redis-cli:Redis命令行客户端
- redis-benchmark:Redis性能测试工具
- redis-check-aof:AOF文件修复工具
- redis-check-dump:RDB文件检查工具
启动和停止
- 直接启动:适用开发环境
redis-server,默认使用6379端口,可以通过--port参数指定端口号 - 初始化脚本启动:生产环境
Redis源代码目录utils文件中有一个redis_init_script的初始化脚本文件,使用脚本启动需要配置Redis的运行方式和持久化文件、日志文件的存储位置等。 - 停止:强制终止进程可能会导致数据丢失,通常是像Redis发送SHUTDOWN命令,kill进程的PID效果一样。
redis-cli SHUTDOWN
多数据库
Redis默认支持16个数据库,可以通过配置参数databases来修改。Redis不支持自定义数据库名字,也不支持为不同库设置访问密码,都是以编号来命名的0~15,所以数据库之间并不完全隔离。所以注意不同的应用要使用不同的Redis实例存储数据。
5种数据类型
[string] 字符串类型:最基本的数据类型,能存储任何形式的字符串,包括二进制数据,允许最大容量是512MB
-
[string] 常用命令
[set/get] 赋值与取值
[incr] 递增数字
- [incrby] 增加指定的整数,通过参数增加指定的数值
- [decr] 减少指定的整数
- [incrbyfloat] 增加指定的浮点数
- [append] 向尾部追加值
- [strlen] 获取字符串长度
- [mget/mset] 同时获得/设置多个键值
- [getbit/setbit/bitcount/bitop] 位操作
[hash] 散列类型:字典结构以键值对的形式存储数据,可以包含232-1个字段
-
[hash] 常用命令
[hset/hget] 赋值与取值
[hexists] 判断字段是否存在
[hsetnx] 当字段不存在时赋值
[hincrby] 增加数字
[hdel] 删除字段
- [hkeys/hvalus] 只获取字段名或字段值
- [hlen] 获取字段数量
[list] 列表类型:存储一个有序的字符串列表,常用的操作是向列表两端添加元素,或者获得列表的某一个片段,一个列表最多容纳232-1个元素
-
[list] 常用命令
[lpush/rpush] 向列表两端增加元素
[lpop/rpop] 从列表两端弹出元素
[llen] 获取列表中元素的个数
[lrange] 获取列表片段
[lrem] 删除列表中指定的值
- [lindex/lset] 获得/设置指定索引的元素值
- [ltrim] 只保留列表指定片段
- [linsert] 向列表中插入元素
- [rpoplpush] 将元素从一个列表转到另一个列表
[set] 集合类型:和列表类型的区别就是无序且去重
-
[set] 常用命令
[sadd/srem] 增加/删除元素
[smembers] 获得集合中的所有元素
[sismember] 判断元素是否在集合中
[sdiff/sinter/sunion] 集合间运算
- [scard] 获得集合中元素个数
- [sdiffstore/sinterstore/sunionstore] 进行集合运算并将结果存储
- [srandmember] 随机获得集合中的元素
- [spop] 从集合中弹出一个元素
[sorted set] 有序集合类型:和集合类型的区别就在于有序
-
[sorted set] 常用命令
[zadd] 增加元素
[zscore] 获得元素的分数,也可做为判断是否存在
[zrange/zreverange] 获得排名在某个范围的元素列表
[zrangebyscore] 获得指定分数范围的元素
[zincrby] 增加某个元素的分数
- [zcard] 获得集合中元素的数量
- [zcount] 获得指定分数范围内的元素个数
- [zremrangebyrank] 按照排名范围删除元素
- [zremrangebyscore] 按照分数范围删除元素
- [zrank/zrevrank] 获得元素的排名
- [zinterstore] 计算有序集合的交集
其它应用场景
Redis不单单可以应用在缓存、数据库、消息队列等方面,根据本身的结构和设计在一些其它的方面也有很好的体现,这里举例几个场景。
- 统计活跃/在线用户:可以通过bitmap实现,能降低内存的空间,包括可以使用bitop、bitcount做计算统计。
- 队列:基于list类型,可以实现队列。
- 消息通知:利用Redis的pub/sub模式,实现订阅/通知,但是不支持分组。
- 延时队列:基于zset类型,因为zset是通过score属性来排序的,这样的话可以通过设置score为时间,轮询的方式来检测消费删除。
redis的应用场景特别多,大多数应用场景是根据redis所支持的数据类型延伸出来的,包括还能通过redis的原子性操作、自增、过期时间等等实现分布式锁。
事务
Redis中的事务(transaction)是一组命令
的集合,Redis保证一个事务中的所有命令要么都执行,要么都不执行。 Redis事务不支持关系数据库事务提供的回滚(rollback)功能。
过程:mulit-----待执行命令----exec
错误处理
- 语法错误:事务中只要有一个命令有语法错误,执行exec后就会直接返回错误,语法正确的命令也不会执行。
- 运行错误:执行时错误,如散列类型命令操作集合类型的键,这种错误执行前redis是无法发现的,所以出现这类错误,事务中其它命令会继续执行。
WATCH命令
监视一个(或多个) key ,监控一直持续到exec命令(事务中的命令是在exec之后才执行的,所以在mulit命令后可以修改watch监控的键值),如果在事务执行之前这个(或这些) key 被其他命令所改动,那么事务将被打断。
UNWATCH
取消 WATCH命令对所有 key 的监视。如果在执行 WATCH命令之后, exec命令或 discard命令先被执行了的话,那么就不需要再执行 UNWATCH了。
因为 exec命令会执行事务,而discard取消事务的同时也会取消对所有key的监视。
DISCARD
取消事务,放弃执行事务块内的所有命令。
EXPIRE生存时间
在Redis中可以使用expire命令设置一个键的生存时间,到时间后Redis会自动删除它。
命令格式:expire key seconds,seconds参数表示键的生存时间,单位为秒。
取消使用persist命令
访问频率限制
通过使用incr命令递增键值来描述次数,通过设置生存时间来自动删除,从而达到限制访问的频率,同时为了保证建立键和为键设置生存时间一起执行(避免某些问题导致中间推出,避免未能设置生存时间而变成永久键),可以把事务也引用进来。
//伪代码
isKeyExists = EXISTS limiting:IP
if isKeyExists is 1
times = INCR limiting:ip
if times >100
print 访问频率超过限制
exit
else
MULTI
INCR limiting:ip
EXPIRE keyName ,60
exit
实现缓存
上面说到使用expire命令来设置了生存时间,就可以用来满足缓存实现的要求,但是为了提高缓存的命用率以及更合理的使用内存资源,需要让Redis按照一定的规则淘汰不需要的缓存键
淘汰规则
规则 | 说明 |
---|---|
volatile-lru | 使用LRU算法删除一个键(已设置生存时间的键) |
allkeys-lru | 使用LRU算法删除一个键 |
volatile-random | 随机删除一个键(已设置生存时间的键) |
allkeys-random | 随机删除一个键 |
volatile-ttl | 删除生存时间最近的一个键 |
noeviction | 不删除,只返回错误 |
排序
前面说到了列表类型,有序集合类型都是满足有序的,这里讲讲怎么完成排序。
sort命令
sort命令可以对列表类型、集合类型和有序集合类型的键进行排序,还可以通过ALPHA
参数实现按照字典顺序排列,DESC
参数倒序等。
by参数
如果提供了by参数,sort命令将不再依据元素自身的值进行排序,而是对每个元素使用元素的值替换参考键中的第一个“*”
并获取其值,然后依据该值对元素排序
## 键名->字段名
sort tag:posts by post:*->time desc
get参数
get参数不影响排序,它的作用是使sort命令的返回结果不再是元素自身的值,而是get参数中指定的键值。
store参数
默认情况下sort会直接返回排序结果,如果希望保存结果,需要使用store参数
性能优化
sort是redis种最强大最复杂的命令之一,时间复杂度是O(n+mlogm),n表示排序的元素个数,m表示返回的元素个数。
- 尽可能减少待排序键中元素的数量,n尽可能小。
- 使用limit参数只获取需要的数据,m尽可能小。
- 如果要排序的数据数量较大,尽可能使用store参数将结果缓存。
消息
任务队列
说到队列通常使用的是Redis的列表类型,使用lpush和rpop命令实现队列。只需要让生产者将任务使用lpush命令加入到某个键中,另一边让消费者不断使用rpop命令从该键中取出任务即可。
优先级队列
可以通过brpop命令来解决,brpop可以同时接收多个键,意义是同时检测多个键,如果所有键都没有元素则阻塞,如果其中有一个键有元素则会从该键中弹出元素,如果多个键都有元素则按照从左到右的顺序去第一个键中的元素。借此特性可以实现区分优先级的任务队列。
发布/订阅
Redis提供了一组命令可以让开发者实现发布/订阅(publish/subscribe)模式。该模式包含了两种角色,发布者和订阅者;可以用来实现消息通知等。
订阅者可以订阅一个或者若干个频道(channel),而发布者可以向指定的频道发送消息,订阅该频道都会收到此消息。
管道
客户端和Redis使用TCP协议连接,无论是发送命令还是返回执行结果都需要经过网络传输,如果执行的命令较多,延时的累加起来对性能还是有一定影响。
管道(pipelining)可以一次性发送多条命令并在执行完后一次性将结果返回。
优化空间
- 精简键名和键值
- 内部编码优化
持久化
Redis支持两种方式的持久化,RDB方式、AOF方式,可单独使用,也可两者结合使用。
-
RDB:通过快照(snapshotting)完成的,当符合一定条件时Redis自动将内存中的所有数据进行快照并存储到硬盘。由用户在配置文件中自定义,两个参数构成:
时间和改动的键个数
;指定时间内更改的键大于这个数值就会进行快照。默认采用这种持久化方式
缺点是定时持久化
-
AOF:通过appendonly参数开启,开启后每执行一条更改的命令,会将该命令写入硬盘的AOF文件,AOF方式是将执行过的写指令记录下来,在数据恢复时按照从前到后的顺序再将指令都执行一遍。AOF文件位置和RDB文件的位置相同,都是通过dir参数设置,将缓存内容同步到硬盘中
默认情况下采用everysec规则,即每秒执行一次同步操作,always表示每次写入都执行同步,最安全也最慢,no表示不主动进行同步而交由操作系统(默认30秒一次),都是通过appendfsync参数设置
。 - 备份/恢复:通过save命令就能生成dump.rdb文件,如果要恢复的话,把文件copy到安装文件目录下,启动服务就可以了,可以通过config get dir查看目录地址。
多机数据库
主要是适用于大型分布式场景
- 复制:简洁来说就是主从复制,主数据库(master),从数据库(slave);主数据库可以进行读写操作,发生写操作时候同步给从数据库,从数据库一般只负责读。
- 使用复制功能很简单,在配置文件中加入“slaveof 主数据 ip 主数据库端口”即可。
- 当从数据库启动后,会向主数据库发送sync命令,主数据库接收后开始后台保存快照及期间接收的命令缓存起来,快照完成后,将快照文件和缓存的命令发送给从数据库。从数据库接收会载入快照文件及执行缓存命令。不支持断点续传。
- 基于复制可以实现读写分离,以及可以通过主从切换来提高数据库的高可用。比如设置主禁用持久化,从开启持久化,主数据库挂掉后,可以把从数据库提升为主数据库,主数据库重启后设置为从数据库即可将数据同步过来。这样能保证数据不会丢失。
- sentinel:哨兵,Redis的高可用解决方案之一,由一个或多个sentinel实例组成的sentinel系统可以监视多个主服务器,以及这些主服务器下的所有从服务器,主服务器下线后自动将下属某个从服务器升级为新的主服务器。
- 集群:Redis提供的分布式数据库方案,集群通过分片(sharding)来进行数据共享,并提供复制和故障转移功能。
- 客户端数据分片,基于客户端hash计算key的节点位置,可以降低服务端的集群复杂度,但是服务器集群资源难以管理,并且动态增删节难以实现,运维性差。
-
服务端数据分配(路由),有服务端来计算key的位置,客户端发送请求到任意节点,服务端接收请求后会将查询请求发送到正确的节点上执行。开源方案:redis-cluster,内置数据自动分片机制,key的落点是通过一致性hash计算所在落点位置,以slot为单位,一共是一万六千多个slot,关于负载,节点之间是可以迁移数据的,以slot为单位的迁移,但不是自动,需要外部命令触发,关于高可用,集群中采用主从,主宕机后会把从提升为主,但如果没有设置从,会导致这个节点的读写服务不可用。
- 使用代理方式(proxy),客户端通过连接代理,代理计算出节点位置,并把请求发送到对应的集群节点,但是代理需要维护集群的节点信息,虽然解耦了,但会增加结构的复杂度和运维的难度。
部分配置参数列表
参数名 | 默认值 | 使用config set设置 |
---|---|---|
daemonize | no | no |
pidfile | /var/run/redis/pid | no |
port | 6379 | no |
databases | 16 | no |
save | save 900 1/save 300 10/save 60 10000 | yes |
rdbcompression | yes | yes |
rdbchecksum | yes | yes |
dbfilename | dump.rdb | yes |
dir | ./ | no |
slaveof | 无 | no |
masterauth | 无 | yes |
slave-serve-stale-data | yes | yes |
slave-read-only | yes | yes |
requirepass | 无 | yes |
rename-command | 无 | no |
maxmemory | 无 | yes |
maxmemory-policy | volatile-lru | yes |
maxmemory-samples | 3 | yes |
appendonly | no | yes |
appendfsync | everysec | yes |
auto-aof-rewrite-percentage | 100 | yes |
auto-aof-rewrite-min-size | 64mb | yes |
lua-time-limit | 5000 | yes |
slowlog-log-slower-than | 10000 | yes |
slowlog-max-lan | 128 | yes |
hash-max-ziplist-entries | 512 | yes |
hash-max-ziplist-value | 64 | yes |
list-max-ziplist-entries | 512 | yes |
list-max-ziplist-value | 64 | yes |
set-max-intset-entries | 512 | yes |
zset-max-ziplist-entries | 128 | yes |
zset-max-ziplist-value | 64 | yes |