Redis有5种基本数据类型
Redis所有的数据结构都是以唯一的key字符串作为名称,然后通过这个唯一key值来获取相应的value数据,不同类型的数据结构的差异就在于value的结构不一样
string(字符串)
键值对
set name codehole
get name
del name
批量键值对(节省网络耗时开销)
mset name1 boy name2 girl name3 unknow
mget name1 name2 name3
计数
如果value值是一个整数,可以对它进行自增操作,自增的范围是 signed long的最大最小值
> set age 30
> incr age
string是动态字符串,是可以修改的字符串,内部结构实现上类似于Java的ArrayList,采用预分配冗余空间的方式来减少内存的频繁分配,内部为当前字符串实际分配的空间 capacity一般要高于实际字符串长度len。
扩容:
当字符串长度小于1M时,扩容是在现有的基础上翻倍
如果超过1M,扩容时一次只会多扩1M的空间
字符串最大长度为512M
【字符串】内部结构
字符串叫[SDS],Simple Dynamic String,它的结构是一个带长度信息的字节数组
struct SDS<T>{
T capacity; //数组容量
T len; // 数组长度
byte flags; // 特殊标志位
byte[] content; // 数组内容
}之所以使用泛型T,是因为当字符串比较短时,len 和capacity可以使用byte和short来表示
list(列表)
相当于java语言里面的LinkedList(链表)插入和删除操作非常快,O(1),
但是索引定位很慢O(n)
基本操作
右进左出: 队列
rpush books python java golang
llen books "3"
lpop books "python"
lpop books "java"
右进右出: 栈
rpush books python java golang
rpop books "golang"
常用来做异步队列
将需要延后处理的任务结构体序列化成字符串塞进Redis的列表,
另一个线程从这个列表中轮询数据进行处理。
慢操作
lindex相当于Java链表的get(int index)方法,需要对链表进行遍历,
性能随着参数index增大而变差
ltrim(start_index,end_index)保留start_index 到end_index之间的值
lrange books 0 -1 # 获取所有元素 O(n) 慎用
快速列表
Redis底层存储的不是linkedlist,而是称之为快速链表quicklist
zset和hash容器对象在元素个数较少的时候,采用压缩列表(ziplist)进行存储,压缩列表是一块连续的内存空间,元素之间紧挨着存储,没有任何冗余空隙
hash(哈希字典)
相当于Java语言里面的HashMap,无序字典。内部实现结构是 数组+链表二维结构
第一维hash的数组位置碰撞时,就会将碰撞的元素使用链表串接起来
Redis字典的值只能是字符串
Java的HashMap在字典很大时,rehash是个耗时的操作,需要一次性全部rehash
Redis为了高性能,不堵塞服务,所以采用了渐进式rehash策略
渐进式rehash
在rehash的同时,保留新旧两个hash结构,查询时会同时查询两个hash结构,然后在后续的定时任务中以及hash的子指令中,循序渐进地将旧hash的内容一点点迁移到新的hash结构中
计数
hash结构中的单个子key也可以进行计数
> hincrby user age 1
扩容条件
当hash表中元素的个数等于第一维数组的长度时,就会开始扩容,扩容的新数组是原数组大小的2倍。不过如果Redis正在做bgsave,为了减少内存也的过多分离(COW),Redis尽量不去扩容,但是如果元素个数已经达到了第一维数组长度的5倍,说明hash表已经过于拥挤,这个时候就会强制扩容
缩容条件
当hash表因为元素越来越稀疏时,Redis会对hash表进行缩容来减少hash表的第一维数组空间占用,缩容的条件是元素个数低于数组长度的10%,不会考虑Redis是否正在做bgsave。
【字典】内部结构
hash内部数据结构就是 dict
dict结构内部包含两个hasttable,通常情况下只有一个hashtable是有值的。但是在dict扩容缩容是,需要分配新的hashtable,然后进行渐进式搬迁,这时候两个hashtable存储的分别是旧的hashtable和新的hashtable,待搬迁结束后,旧的hashtable被删除,新的hashtable取而代之。
set(集合)
相当于Java中的HashSet,内部键值对是无序的唯一的,内部实现相当于一个特殊的字典,
字典中所有的value都是一个值NULL
可以存储活动中奖的用户ID,因为有去重功能,可以保证同一个用户不会中奖两次
> sadd books python >1
> sadd books python # 重复 >0
> sadd books java golang >2
> smember books # set无序的,所以输出顺序和插入顺序并不一致
> sismember books java # 查询某个value时候存在,相当于contains(o)
> scard books # 获取长度相当于count()
> spop books # 弹出一个
zset(有序集合)
类似于Java的SortedSet和HashMap的结合体,
一方面是一个set,保证了内部value的唯一性,另一个面他可以给每个value赋予一个score,代表这个value的排序权重,
内部实现用是【跳跃列表】的数据结构
可以用来存粉丝列表 value值是粉丝的用户Id score是关注时间
常用指令
> zadd books 9.0 "think in java" > 1
> zadd books 8.9 "java concurrency" >1
> zrange books 0 -1 按score排序列出,参数区间为排名范围
> zrevrange books 0 -1 score逆序列出,参数区间为排名范围
> zcard books # 相当于count()
> zscore books "java concurrency" # 获取指定value的score,内部score使用double类型进行存储,所以存在小数点精度问题
> zrank books "java concurrency" # 排名
> zrangebyscore books 0 8.91 # 根据分值区间遍历zset
> zrem books "java concurrency" # 删除value
容器型数据结构的通用规则
list/set/hash/zset 这四种数据结构是容器型数据结构
1、 create if not exists
如果容器不存在,那就创建一个,再进行操作
2、 drop if no elements
如果容器里元素没有了,那么立即删除元素,释放内存
过期时间
Redis所有的数据结构都可以设置过期时间。
注意
1.过期时间以对象为单位,比如一个hash结构的过期是整个hash对象的过期而不是其中的某一个子key
2.如果一个字符串已经设置了过期时间,然后你调用了set方法修改了它,他的过期时间会失效
位图(bitmap)
可以用户用户签到记录,签了是1,没签是0
get/set 获取和设置整个位图的内容
getbit/setbit 位图操作
将byte数组看成【位数组】来处理
基本操作
零存零取
setbit 存 getbit 取
零存整取
setbit 存 get 取
整存零取
set 存 getbit 取
统计和查找
统计:bitcount 用来统计指定位置范围内1的个数
查找:bitpos 用来查找指定范围内出现的第一个0或1
魔术指定 bitfield
setbit和getbit指定位的值都是单个位的
HyperLogLog
一般用来解决统计问题(但是不是很精确)标准误差0.81%
一般用作网站PV与UV的统计
常用指令
pfadd 增加计数
pfcount 获取计数
pfmerge 用于将多个pf计数值累加在一起形成一个新的pf值
GEOHash
Pub/Sub
以上内容参考钱文品老师的 <Redis深度历险: 核心原理与应用实战>