构建高效可伸缩的结果缓存

几乎所有的服务器应用程序都会使用某种形式的缓存。中用之前的计算结果能降低延迟，提高吞吐量，但却会消耗更多的内存。
这博客记录一下如果开发一个高效可伸缩的缓存，将从简单的hashmap开始，然后一步步分析他的性能缺陷，并记录如何修复这些缺陷。

目标需求

在Computable<A,V>接口中声明一个函数，Computable，其输入类型为A，输出类型为V。在ExpensiveFunction中实现的Computable需要很长的时间结算结果，我们将创建一个Computable的包装器，帮助记住之前的计算结果，并将缓存过程封装起来。

实现方式1

import java.math.BigInteger;
import java.util.HashMap;
import java.util.Map;

public class CacheTest1 {

}

class ExpensiveFunction implements Computable<String, BigInteger>{
    @Override
    public BigInteger comput(String args) throws InterruptedException {
        // 这里是一个计算很长的过程
        return new BigInteger(args);
    }
}

class Memoizer1<A, V> implements Computable<A, V>{

    private final Map<A,V> cache=new HashMap<A,V>();
    private final Computable<A,V> c;
    
    public Memoizer1(Computable<A,V> _c){
        this.c=_c;
    }
    
    @Override
    public synchronized V comput(A arg) throws InterruptedException {
        V result=cache.get(arg);
        if(result==null){
            result=c.comput(arg);
        }
        return result;
    }
    
}

在上面程序，Memoizer1给出了第一种尝试，使用HashMap保存之前的计算结果。compute方法检查需要的结果是否在缓存中，如果存在则把结果返回，否则重新计算然后把结果放到HashMap中。

上面的代码存在2个问题，1、因为HashMap不是线程安全的，因此需要synchronized进行方法同步，但是这样做的话同时只能有一个线程执行compute，如果某个线程执行计算的时间很长，那么将会出超时阻塞。2、会造成重复计算，由于计算时间过长，其他的线程并不知道这个计算正在进行，因此会继续重复计算。

实现方式2

import java.math.BigInteger;
import java.util.HashMap;
import java.util.Map;
import java.util.concurrent.ConcurrentHashMap;

public class CacheTest2 {

}

class ExpensiveFunction implements Computable<String, BigInteger>{
    @Override
    public BigInteger comput(String args) throws InterruptedException {
        // do something
        return new BigInteger(args);
    }
}

class Memoizer1<A, V> implements Computable<A, V>{

    private final Map<A,V> cache=new ConcurrentHashMap<A,V>();
    private final Computable<A,V> c;
    
    public Memoizer1(Computable<A,V> _c){
        this.c=_c;
    }
    
    @Override
    public V comput(A arg) throws InterruptedException {
        V result=cache.get(arg);
        if(result==null){
            result=c.comput(arg);
        }
        return result;
    }
    
}

在上面代码中，将hashmap替换成了concurrnethashmap，由于concurrenthashmap类本身是线程安全的因此在访问底层map就不需要增加synchronized，因此就避免了compute方法的串行性，提高了并发行为。

虽然上面代码解决了并发问题，但是依然存在一个问题就是会存在重复计算问题，这种方案依然不够完美，我们继续完善，继续向下看。

实现方式3

import java.math.BigInteger;
import java.util.Map;
import java.util.concurrent.Callable;
import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.Future;
import java.util.concurrent.FutureTask;

public class CacheTest3 {

}

class ExpensiveFunction implements Computable<String, BigInteger> {
    @Override
    public BigInteger comput(String args) throws InterruptedException {
        // do something
        return new BigInteger(args);
    }
}

class Memoizer1<A, V> implements Computable<A, V> {

    private final Map<A, Future<V>> cache = new ConcurrentHashMap<A, Future<V>>();
    private final Computable<A, V> c;

    public Memoizer1(Computable<A, V> _c) {
        this.c = _c;
    }

    @Override
    public V comput(A arg) throws InterruptedException {
        Future<V> f = cache.get(arg);
        if (f == null) {
            Callable<V> eval = new Callable<V>() {
                @Override
                public V call() throws Exception {
                    return c.comput(arg);
                }
            };
            FutureTask<V> ft = new FutureTask<V>(eval);
            f = ft;
            cache.put(arg, ft);
            ft.run();
        }
        V v=null;
        try {
            v=f.get();
        } catch (ExecutionException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        return v;
    }

}

上面代码使用了futuretask，futuretask表示一个计算的过程，这个过程可能已经计算完成，也可能正在进行。如果结果可用，那么futuretask.get将立刻返回结果，否则它会一直阻塞，知道有结果在返回。

在comput函数中，会先从cache中获得当前计算内容是否在计算，如果没有在计算，那么创建一个FutureTask放到map中，然后启动这个计算；如果有在计算则直接调用get等待返回结果。

上面的方案其实已经很完美了，它表现出了非常好的并发特性，但是还是存在一点小小的缺陷，在高并发状态下，仍然会存在重复计算问题。问题的根本原因就是在if的代码块中是非原子的“先检查在执行”操作，因此两个线程仍有可能在同一时间调用compute计算相同的值。

最终实现

import java.math.BigInteger;
import java.util.Map;
import java.util.concurrent.Callable;
import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.Future;
import java.util.concurrent.FutureTask;

public class CacheTest3 {

}

class ExpensiveFunction implements Computable<String, BigInteger> {
    @Override
    public BigInteger comput(String args) throws InterruptedException {
        // do something
        return new BigInteger(args);
    }
}

class Memoizer1<A, V> implements Computable<A, V> {

    private final Map<A, Future<V>> cache = new ConcurrentHashMap<A, Future<V>>();
    private final Computable<A, V> c;

    public Memoizer1(Computable<A, V> _c) {
        this.c = _c;
    }

    @Override
    public V comput(A arg) throws InterruptedException {
        Future<V> f = cache.get(arg);
        if (f == null) {
            Callable<V> eval = new Callable<V>() {
                @Override
                public V call() throws Exception {
                    return c.comput(arg);
                }
            };
            FutureTask<V> ft = new FutureTask<V>(eval);
            f=cache.putIfAbsent(arg, ft);
            if(f==null){
                f=ft;
                ft.run();
            }
        }
        V v=null;
        try {
            v=f.get();
        } catch (ExecutionException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        return v;
    }

}

实现方式3中存在的问题是复合操作实在底层的map对象上执行的，而这个对象无法通过加锁来保持原子性。在最终实现中使用了concurrnethashmap中的原子方法putifabsent，避免了重复计算问题。

最后编辑于：2017.12.05 02:24:21

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,547评论 6赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,399评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,428评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,599评论 1赞 274
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,612评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,577评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,941评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,603评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,852评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,605评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,693评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,375评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,955评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,936评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,172评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,970评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,414评论 2赞 342