一文让你明白什么是缓存穿透、击穿、雪崩

缓存是互联网开发中必不可少的一部分，它能降低我们数据库的并发数，提高我们系统的性能，比如我们经常使用的redis、emCached等等，其中redis应该是大部分的人选，为什么？因为速度快，易上手，是很多开发者的首选，但是缓存同样存在这问题，如果使用的不恰当，也可能会造成非常严重的后果，这时候你可能就会有疑问，缓存只是存储一些数据而已，怎么会造成严重的后果呢？下面带大家一起来分析分析。

什么是缓存

缓存（cache），原始意义是指访问速度比一般随机存取存储器（RAM）快的一种高速存储器，通常它不像系统主存那样使用DRAM技术，而使用昂贵但较快速的SRAM技术。缓存的设置是所有现代计算机系统发挥高性能的重要因素之一。
比如我们的redis、他就是缓存中比较常见的一种，他的并发读写能力能达到10w/s左右的速度，这个速度是相当不错的，相对于传统的数据存储来说，比如数据库，快了不知道多少倍，传统的数据库（mysql）操作的都是磁盘，而redis操作的是内存（ram），所以他们的速度肯定是没法比较的，由于传统数据库的读写较慢，所以并发较高的时候就会造成性能瓶颈问题，这也是为什么需要引入缓存的原因之一。

人在地上走，锅从天上来
我是一个快乐的程序狗，每天最快乐的事情就是codding，最大的愿望就是能准时6点下班，然后回家，但是愿望总实现不了，现在是17：30，我们的测试小哥哥给我提了一个很诡异的bug，但是作为一个程序狗，肯定都有着一颗和bug战斗到底的决心，究竟是什么bug呢？
bug是这样的：并发请求订单信息，没过几秒就抛出系统错误。这个bug看着没几个字，但是一看就知道不好解决，尤其是像这种并发bug，能让人瞬间白了头，随后我找到了测试，让他们复现了这个神秘的bug，而我也找到了产生这个bug的来源，并且快速的修复了他，到底是什么问题呢？是因为小明（同事）在编写代码的时候考虑的不是很周全导致的，所以开发一定要想仔细了再动手，否则吃亏的就是自己啊。

缓存穿透

缓存穿透指的是：同一时刻，大量的并发请求数据库中不存在的信息，他既不会命中缓存，也不会命中数据库，但是他会查找数据库。
上面的bug也是因为它产生的，测试的小哥哥查询的订单都是数据库不存在的，所以这个时候这些并发请求都不会命中缓存（redis），将直达数据库（mysql），由于大量的并发请求到达数据库，而数据库承受不住这么高的并发，从而导致数据库奔溃，这就是缓存穿透。
重现bug
1.新建数据表：订单表，结构如下：

image.png

2.编写测试代码
OrderBo.java

package com.ymy.bo;

import lombok.Data;

import java.io.Serializable;
import java.math.BigDecimal;

@Data
public class OrderBo implements  Serializable {

    /**
     * 自增id
     */
    private Long id;

    /**
     *订单编号
     */
    private Long orderCode;

    /**
     *订单价格
     */
    private BigDecimal orderPrice;

    /**
     *商品名称
     */
    private String  peoductName;

    /**
     *创建时间
     */
    private String createTime;
}

OrderController.java

package com.ymy.controller;

import com.ymy.bo.OrderBo;
import com.ymy.service.OrderService;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RequestMethod;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;

@RestController
public class OrderController {

    private OrderService orderService;

    public OrderController(OrderService orderService){
        this.orderService = orderService;
    }

    @RequestMapping(value = "/detail",method = RequestMethod.GET)
    public OrderBo getDetail(@RequestParam("id") Long id){

        return orderService.getDetail(id);
    }


}

OrderService.java

package com.ymy.service;

import com.ymy.bo.OrderBo;
import com.ymy.mapper.OrderMapper;
import lombok.extern.slf4j.Slf4j;
import org.springframework.data.redis.core.RedisTemplate;
import org.springframework.stereotype.Service;

@Service
@Slf4j
public class OrderService {

    private RedisTemplate redisTemplate;

    private OrderMapper orderMapper;

    public OrderService(RedisTemplate redisTemplate,OrderMapper orderMapper){
        this.redisTemplate = redisTemplate;
        this.orderMapper = orderMapper;
    }
    /**
     * 通过id查询订单详情
     * @param id
     * @return
     */
    public OrderBo getDetail(Long id) {

        //缓存中查询词词订单
        OrderBo  orderBo = (OrderBo) redisTemplate.opsForValue().get("order:" + id);
        if(orderBo != null ){
            log.info("缓存中查询到了信息，直接返回：{}",orderBo);
            return orderBo;
        }
        log.info("前往数据库查询");
        orderBo =  orderMapper.getDetail(id);
        if(orderBo != null ){
           //将数据保存到数据库，有效时间一小时
           redisTemplate.opsForValue().set("order:" + id,orderBo,3600,TimeUnit.SECONDS);
           log.info("数据已经存入缓存");
        }
        return orderBo;
    }
}

OrderMapper.java

package com.ymy.mapper;

import com.ymy.bo.OrderBo;
import org.apache.ibatis.annotations.Mapper;
import org.apache.ibatis.annotations.Select;

@Mapper
public interface OrderMapper {
    /**
     * 通过订单id查询订单信息
     * @param id
     * @return
     */
    @Select(" select id,order_code as orderCode,order_price as orderPrice,peoduct_name as peoductName,create_time as createTime from orders where id = #{id} ")
    OrderBo getDetail(Long id);
}

RedisConfig.java

package com.ymy.config;

import com.fasterxml.jackson.annotation.JsonAutoDetect;
import com.fasterxml.jackson.annotation.PropertyAccessor;
import com.fasterxml.jackson.databind.ObjectMapper;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import org.springframework.data.redis.connection.RedisConnectionFactory;
import org.springframework.data.redis.core.RedisTemplate;
import org.springframework.data.redis.serializer.Jackson2JsonRedisSerializer;
import org.springframework.data.redis.serializer.StringRedisSerializer;

@Configuration
public class RedisConfig {

    @Bean
    public RedisTemplate<Object, Object> redisTemplate(RedisConnectionFactory redisConnectionFactory) {
        RedisTemplate<Object, Object> redisTemplate = new RedisTemplate<>();
        redisTemplate.setConnectionFactory(redisConnectionFactory);

        // 使用Jackson2JsonRedisSerialize 替换默认序列化
        Jackson2JsonRedisSerializer jackson2JsonRedisSerializer = new Jackson2JsonRedisSerializer(Object.class);

        ObjectMapper objectMapper = new ObjectMapper();
        objectMapper.setVisibility(PropertyAccessor.ALL, JsonAutoDetect.Visibility.ANY);
        objectMapper.enableDefaultTyping(ObjectMapper.DefaultTyping.NON_FINAL);

        jackson2JsonRedisSerializer.setObjectMapper(objectMapper);

        // 设置value的序列化规则和 key的序列化规则
        redisTemplate.setKeySerializer(new StringRedisSerializer());
        redisTemplate.setValueSerializer(jackson2JsonRedisSerializer);
        redisTemplate.setHashKeySerializer(new StringRedisSerializer());
        redisTemplate.setHashValueSerializer(jackson2JsonRedisSerializer);
        redisTemplate.afterPropertiesSet();
        return redisTemplate;
    }
}

上面的代码实现的功能很简单，通过订单id查询订单详情，不过查询的循序是先查缓存，如果缓存没有数据，在查询数据库，大致流程图如下：

image.png

这个过程很简单，看上去没有什么问题，如果你仔细观察的话就会发现一个致命的问题，就是刚刚说的缓存穿透问题，我们来做个实验。

我在数据库提前添加了一条数据，信息如下：

image.png

正常情况：查询id等于1的订单信息。

第一次：

image.png

2020-04-19 15:55:35.564  INFO 20188 --- [nio-9900-exec-1] com.ymy.service.OrderService             : 前往数据库查询
2020-04-19 15:55:35.675  INFO 20188 --- [nio-9900-exec-1] com.ymy.service.OrderService             : 数据已经存入缓存

由于是第一次查询，所以缓存中不会存在数据，请求直接到达了数据库，并且获取到了id为1的数据，并且将数据添加到了缓存。

image.png

第二次查询id等于1的数据

2020-04-19 15:57:47.879  INFO 20188 --- [nio-9900-exec-5] com.ymy.service.OrderService             : 缓存中查询到了信息，直接返回：OrderBo(id=1, orderCode=202004191416, orderPrice=3299.00, peoductName=iphone se2, createTime=2020-04-19 14:17:07)

我们发现他直接命中了缓存，直接返回，这是正常情况，那如果非正常情况呢？比如查询的订单id=-1呢？这个时候会发生什么事情？
http://localhost:9900/detail?id=-1

image.png

看到没有，请求全都进入数据库了，这种情况是肯定不被允许的，如果你的程序中存在这种情况，一定要赶紧修改，否则有可能会让一些心怀不轨的人直接将数据库的服务搞宕机，那这种问题如何解决呢？

解决方案
将空数据存入缓存
什么意思呢？简单点来说，不管数据库中有没有查询到数据，都往缓存中添加一条数据，这样下次请求的时候就会直接在缓存中返回，这种方式比较简单粗暴，我们一起看看如何实现。

代码改造：

OrderService.java

 public OrderBo getDetail(Long id) {
        //缓存中查询词词订单
        Object obj =  redisTemplate.opsForValue().get("order:" + id);
        if(obj != null ){
            String data = obj.toString();
            log.info("缓存中查询到了信息，直接返回：{}",data);
            return  "".equals(data)  ? null : (OrderBo) obj;
        }
        log.info("前往数据库查询");
        OrderBo orderBo =  orderMapper.getDetail(id);
        if(orderBo != null ){
            //将数据保存到数据库，有效时间一小时
           redisTemplate.opsForValue().set("order:" + id,orderBo,3600,TimeUnit.SECONDS);
           log.info("数据已经存入缓存");
        }else {
            redisTemplate.opsForValue().set("order:" + id,"",300,TimeUnit.SECONDS);
            log.info("数据库中不存在此数据，但是为了防止缓存穿透，存入一条空数据到缓存中");
        }
        return orderBo;
    }

往缓存中添加数据的时候一定要注意值的问题，请看我这里，我添加的是一个空字符串，并不是null，是因为我判断的条件是缓存中！=null就直接返回，如果你往缓存中添加一条null的数据，这个时候就会和你的判断起冲突，又会进入到数据库了，所以这点需要特别注意，我们来看测试：
第一次请求：http://localhost:9900/detail?id=-1

2020-04-19 16:23:21.520  INFO 16596 --- [nio-9900-exec-6] com.ymy.service.OrderService             : 前往数据库查询
2020-04-19 16:23:21.577  INFO 16596 --- [nio-9900-exec-6] com.ymy.service.OrderService             : 数据库中不存在此数据，但是为了防止缓存穿透，存入一条空数据到缓存中

第二次请求：http://localhost:9900/detail?id=-1

2020-04-19 16:24:25.855  INFO 16596 --- [nio-9900-exec-9] com.ymy.service.OrderService             : 缓存中查询到了信息，直接返回：

这个时候请求命中了缓存，就不会前往数据库中了，但是这个需要注意一点：空值的过期时间不能设置的太长，什么意思呢？设想一下，我们现在数据库中只有id=1的数据，我们查询id=2也会往缓存中插入一条数据，但是这个时候数据库中新增了一条订单id=2，用户下次查询的时候看到你存储在缓存中中的数据，接直接回了空，但是数据库中明明已经添加了这条数据，这就是为什么过期时间不要设置太久的原因，当然了，我们也需要分情况考虑，比如查询id<=0的，我们都可以考虑永久存入缓存或者设置很长的过期时间，推荐设置很长的过期时间，为什么呢？因为订单id不存在会<=0，但是对于>=0，我们可以将过期时间设置为30秒等等，这个看业务需求即可。

布隆过滤器
布隆过滤器（Bloom Filter）是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般的算法要好的多，缺点是有一定的误识别率和删除困难。
这个算法实现起来比上面第一种稍微复杂一点，这里就不具体说明了，如果感兴趣的话可以百度自行了解一下，不是很难。

缓存击穿

什么是缓存击穿
缓存击穿是指热点key在某个时间点过期的时候，而恰好在这个时间点对这个Key有大量的并发请求过来，从而大量的请求打到db（数据库）。
这个也不难理解，和缓存穿透有点像但是性质又不相同，都是缓存中没有数据，请求命中数据库，缓存穿透指的是数据库中不存在的数据，缓存击穿则是指缓存失效的问题。，这种情况不太好模拟，我们可以直接将缓存中数据清空，替代缓存数据过期。
代码还是上面的代码，不做任何修改，不过我们不再使用postman测试，而是采用jemter，首先我们删除缓存中的数据，模拟key已经过期，我们查询id=1的订单详细信息，但需要注意的是，我并不是发一个请求，而是100个同时请求，会发生什么呢？
线程数：

image.png

Http请求信息

image.png

聚合报告

image.png

我们发现100个并发请求全部成功，异常率为0，接下来就是重点了，控制台会打印什么呢？

image.png

这就是缓存击穿，是不是很恐怖，虽然命中数据库的次数不是很多，那是因为我们的并发请求不是很大，像双十一这种并发，如果存在这种问题，数据库可能撑不过3秒就炸了。

解决方案
自动更新
什么是自动更新呢？这个有点类似与jwt的自动刷新token机制，jwt的自动刷新token实现原理大致为：请求的时候判断一下token的剩余有效时间，如果有效时间小于设定的时间，那么jwt将生成一个新的token，然后再将次token重新设置过期时间，并将新的token返回给前端使用，这个也可以参考一下，redis是支持查询某个key剩余有效时间，所以这里我们只需要设定一个时间差，比如3分钟，请求的时候查询的有效时间如果小于3分钟，那么刷新这个key的有效时间，刷新这个操作可以使用异步实现（提高性能）。
可能你想到了，这种方式存在缺陷，没错，如果再快失效的3分钟内没有请求，那么缓存中的key将不会被刷新，还是会存在缓存击穿的问题，所以这种方式不是特别推荐

定时刷新
定时刷新有两种方案
第一种：定时任务
查询快要过期的key，更新内容，并刷新有效时间，这种比较消耗服务器性能，也不是特别推荐。
第二种：延迟队列
如果大家了解它的话可能一下就知道我说的是什么意思了，将数据存入缓存的那一刻同时发送一个延迟队列（安指定时间消费），时间小于缓存中key的过期时间，到了指定时间，消费者刷新key的有效时间再发送一个延迟队列，以此循环，这种方式还是不错的，但是实现方式相对于第一种来说就要复杂一点了，他需要依靠消息中间件来完成，如果消息中间件某个时间宕机，那就gg了，虽然这种方式虽然比较推荐，但是成本偏高，因为为了防止消息中间件宕机，我们有可能需要对消息中间件做集群处理。

程序加锁
我个人推荐使用这个，为什么呢？因为它不需要额外的服务器开销，也不需要额外的资源消耗，他仅仅只是让线程串行而已，但是这个时候你可能就会有疑问了，加锁不是会严重影响程序的效率吗？为什么你还推荐这种方式呢？
其实并不是所有的锁都会很大的降低程序的性能，这里我们当然不能使用synchronized，原因很简单，他的效率比较慢，不太适合这种情况，我要介绍的这种锁名字为：读写锁。

好了，我们一起来改造一下之前的代码
OrderService.java

package com.ymy.service;

import com.ymy.bo.OrderBo;
import com.ymy.mapper.OrderMapper;
import lombok.extern.slf4j.Slf4j;
import org.springframework.data.redis.core.RedisTemplate;
import org.springframework.stereotype.Service;

import java.util.concurrent.TimeUnit;
import java.util.concurrent.atomic.AtomicInteger;
import java.util.concurrent.locks.Lock;
import java.util.concurrent.locks.ReadWriteLock;
import java.util.concurrent.locks.ReentrantReadWriteLock;

@Service
@Slf4j
public class OrderService {

    private RedisTemplate redisTemplate;

    private OrderMapper orderMapper;

    private static  final AtomicInteger count = new AtomicInteger(0);


    private static final ReadWriteLock readWriteLock = new ReentrantReadWriteLock();


    public OrderService(RedisTemplate redisTemplate, OrderMapper orderMapper) {
        this.redisTemplate = redisTemplate;
        this.orderMapper = orderMapper;
    }


    /**
     * 通过id查询订单详情
     *
     * @param id
     * @return
     */
    public  OrderBo getDetail(Long id) {
        int num = count.incrementAndGet();
        //获取读锁
        Lock readLock = readWriteLock.readLock();
        try {
            readLock.lock();
            //缓存中查询订单信息
            log.info("前往缓存中查询信息，第一次,这是第：{}次请求",num);
            Object obj = redisTemplate.opsForValue().get("order:" + id);
            if (obj != null) {
                String data = obj.toString();
                log.info("缓存中查询到了信息，直接返回：{}", data);
                return "".equals(data) ? null : (OrderBo) obj;
            }
            log.info("没有在缓存中获取到数据，即将前往数据库获取,这是第：{}次请求",num);
        } finally {
            //释放读锁
            readLock.unlock();
        }
        //获取写锁
        Lock writeLock = readWriteLock.writeLock();
        try{
            writeLock.lock();
            //缓存中查询订单信息
            log.info("第二次前往缓存中查询信息，这是第：{}次请求",num);
            Object obj = redisTemplate.opsForValue().get("order:" + id);
            if (obj != null) {
                String data = obj.toString();
                log.info("缓存中查询到了信息，直接返回：{}", data);
                return "".equals(data) ? null : (OrderBo) obj;
            }
            log.info("前往数据库查询,这是第：{}次请求",num);
            OrderBo orderBo = orderMapper.getDetail(id);
            log.info("数据库返回的数据：{},这是第：{}次请求",orderBo,num);
            if (orderBo != null) {
                //将数据保存到数据库，有效时间一小时
                redisTemplate.opsForValue().set("order:" + id, orderBo, 3600, TimeUnit.SECONDS);
                log.info("数据已经存入缓存,这是第：{}次请求",num);
            } else {
                redisTemplate.opsForValue().set("order:" + id, "", 300, TimeUnit.SECONDS);
                log.info("数据库中不存在此数据，但是为了防止缓存穿透，存入一条空数据到缓存中,这是第：{}次请求",num);
            }
            return orderBo;
        }finally {
            writeLock.unlock();
        }
    }
}

加了读写锁之后我们一起来看看控制台的输出结果：

image.png

这只是其中一部分，由于输出的内容过长我就不全部展示出来了，我们这里需要关注的只有一个，数据库查询了多少次？
我们将控制台日志拷贝到notepad++中，搜索“数据库返回的数据”，请看结果：

image.png

我们可以看到，查询数据库的操作只有一处，但是查询缓存的确实并发执行的，这就是为什么我推荐使用读写锁的原因，读写锁中读锁和写锁是互斥的，你觉得这样速度还是不够快，能不能读锁和写锁并行？答案是肯定的

缓存雪崩

什么是缓存雪崩
缓存雪崩是指缓存中数据大批量到过期时间，而查询数据量巨大，引起数据库压力过大甚至宕机。
为什么会出现大批量的key过期呢？是不是我们设置了相同的过期时间导致的？

解决方案
随机设置过期时间
这个随机时间并不是真正的随机时间，而是指在原来过期时间的基础上生成一个随机时间，这个随机时间比较小，然后两者相加即可

设置永久有效
将一些常用的数据设置成为永久有效，注意哦，是经常使用的而不是全部，这点需要特别注意。

总结

什么是缓存穿透？

同一时刻，大量的并发请求数据库中不存在的信息，他既不会命中缓存，也不会命中数据库，但是他会查找数据库。

什么是缓存击穿？

缓存击穿是指热点key在某个时间点过期的时候，而恰好在这个时间点对这个Key有大量的并发请求过来，从而大量的请求打到db（数据库）。

什么是缓存雪崩？

缓存中数据大批量到过期时间，而查询数据量巨大，引起数据库压力过大甚至宕机
并不是只有上面几种解决方案，这里我只是讲解了几种常用的解决方案，在日常开发中我们可以根据实际的业务需求进行选择，没有最好的，只有最适合自己的，所以不一定要选择最牛逼的解决方案，但是一定要选择最适合项目的解决方案。

image.png