LruCache原理和源码分析（一）

一、Lru算法

Lru算法：最近最少使用算法；

算法的核心关键类是LinkedHashMap。

基本算法：将key-value键值对按照访问顺序进行排列放置，当存入的数据超过最大内存分配时，移除最久访问的数据；

所以要搞清楚LruCache的原理，首先需要研究LinkedHashMap这个类；

LinkedHashMap继承自HashMap，自然也就继承了HashMap中的众多方法，所以在研究LinkedHashMap之前，有必要去研究下LinkedHashMap的父类HashMap;

二、Map接口

Map接口，key-value集合的抽象，反映了单个的key映射着单个的value这样一种数据结构；

它的核心行为是
存入key-value，对应着put(key,value)方法和根据key来取出value，对应着get(key);
然后为了功能上的完善，还提供了其他的接口：

//清除map中的所有数据
clear();
//是否包含某个key
containsKey(key);
//是否包含某个value
containsValue(value);
//map是否为空
isEmpty()
//根据某个key来移除key-values
remove(key)

三、HashMap——Map的实现；

3.1. HashMapEntry

它是HashMap中的一个内部类，它是HashMap存储的数据单元，HashMap中的存储数组的存储单位就是HashMapEntry

        final K key;
        V value;
        final int hash;
        HashMapEntry<K, V> next;

主要有四个值，key，values，hash和next，这个next是为了解决hash冲突而设置的，当存在hash冲突时，next会链式地指向下一个HashMapEntry对象；这个具有相同table index的entry可以链式存储到table中的同一个位置；

废话不多说了，直接进入到HashMap的核心方法get(key)和put(key,value)方法；

3.2. put(key,value)方法

    public V put(K key, V value) {
        if (key == null) {
            return putValueForNullKey(value);
        }
        //根据key来计算hash值，至于为什么是Collections.secondaryHash(key)？
        //这样做只是为了使得hash分布更均匀，避免hash冲突；
        //具体来参考大神的解释：http://burtleburtle.net/bob/hash/integer.html
        int hash = Collections.secondaryHash(key);
        //这里就是要存储数据的数组，基本元素是HashMapEntry
        HashMapEntry<K, V>[] tab = table;
        //根据hash值和table的长度来计算索引index值，注意一点，计算的index值不能超过数组的索引范围
        int index = hash & (tab.length - 1);
        //这一步，需要自己品味和分析，首先抛出一个问题：如果两个不同的key，计算得到的index恰巧相同，这种情况下怎么办呢？
        //上面的问题，其实就是发生了hash冲突如何解决的问题，HashMap采用的方法是，当index值相同时，采用链式的存储方式来存储不同的key-value值
        //这么说不明白？不要着急，看下面代码，且听我来细细道来（解释废话比较多，放在代码后边，文字里叙述，免得注释过多）：
        
        for (HashMapEntry<K, V> e = tab[index]; e != null; e = e.next) {
            if (e.hash == hash && key.equals(e.key)) {
                preModify(e);
                V oldValue = e.value;
                e.value = value;
                return oldValue;
            }
        }

        // No entry for (non-null) key is present; create one
        modCount++;
        if (size++ > threshold) {
            tab = doubleCapacity();
            index = hash & (tab.length - 1);
        }
        addNewEntry(key, value, hash, index);
        return null;
    }

首先处理key为null的情况，根据成员属性entryForNullKey是否为null，如果为null，则调用addNewEntryForNullKey(value)方法来对其进行赋值：

    void addNewEntryForNullKey(V value) {
        entryForNullKey = new HashMapEntry<K, V>(null, value, 0, null);
    }

这种情况不做过多的论述；

接下来，是重点哈哈哈哈~~~好像重点有点画多了哈哈哈，不过下面是重点中的重点：

HashMap是通过基础的数据类型数组HashMapEntry[] table来存入key-value键值对的；
what？？没有搞错把？搞了半天，HashMap是用数组来实现数据存储的？？数组的使用我想大家都没有问题把》》》

当我们往HashMap中存入键值对的时候，会根据key来计算出一个int类型的hash值，然后再将这个hash值转换成table长度范围内的索引index，再将value赋值给table[index],经过这样一个过程，就实现了key-value到数组存储的转化；

两个不同的key，计算得到index值一样时，也就是存在hash冲突时，HashMap是如何处理的？

第一次得到index值时，此时的table[index]为null，所以直接存入addNewEntry(key, value, hash, index)；
第二次得到index值时，此时的table[index]不为null，进入for循环，判断是不是相同的key，如果是，则存入newValue，返回oldValue；
如果不是相同的key，for循环中if条件为false，走addNewEntry(key, value, hash, index)；

    //我们仔细回顾下，在执行这个方法之前，table[index]已经存入了第一次得到index时的hashMapEntryOne，
    //那么new HashMapEntry<K, V>(key, value, hash, table[index]),生成新的对象hashMapEntryTwo，它的内部成员属性next指向了hashMapEntryOne；
    //结果就是table[index]存入了hashMapEntryTwo的引用，然后hashMapEntryTwo的next又指向了hashMapEntryOne；
    //这样存在hash冲突的两个key-values键值对，就以链式数据结构，存储到了table[index]下；
    
    void addNewEntry(K key, V value, int hash, int index) {
        table[index] = new HashMapEntry<K, V>(key, value, hash, table[index]);
    }
    
    HashMapEntry(K key, V value, int hash, HashMapEntry<K, V> next) {
            this.key = key;
            this.value = value;
            this.hash = hash;
            this.next = next;
    }

3.3. get(key)方法

    public V get(Object key) {
    //首先处理key为null的情况，根据成员属性entryForNullKey的值来返回null或者entryForNullKey的value；
        if (key == null) {
            HashMapEntry<K, V> e = entryForNullKey;
            return e == null ? null : e.value;
        }

        int hash = Collections.secondaryHash(key);
        HashMapEntry<K, V>[] tab = table;
        for (HashMapEntry<K, V> e = tab[hash & (tab.length - 1)];
                e != null; e = e.next) {
            K eKey = e.key;
            if (eKey == key || (e.hash == hash && key.equals(eKey))) {
                return e.value;
            }
        }
        return null;
    }

当根据key来获取对应的value时，其实是上述过程的逆过程：
首先根据key的值来按照特定的算法计算出对应的hash值，然后将hash值转换成数组table的索引index，然后取出table[index]中存储的值hashMapEntry，依次去遍历hashMapEntry中的值（链式存储，当存在hash冲突时，可能会有多个值，依次从next中取出值），在if条件判断中比较hashMapEntry的key是否与参数key相同，相同的话，说明当前的hashMapEntry的value是我们要取的值；
否则的话，返回null；

整个HashMap的核心就是将key映射到内部存储结构table的index的方法+HashMapEntry链式数据结构来解决hash冲突：

四、几个关键问题

4.1. 如何避免和解决hash冲突的

HashMap解决hash冲突的方法：
hash复用，同一个hash值，链式地加入多个value；
即如果不同的key，计算出的table index相同的话，那么会将这些值存入table[index]中，而table[index]的值HashMapEntry为链式存储结构，可以链式的的放入多个值；

4.2.如何解决HashMap容量不足的问题

前面解决了hash冲突的问题，那么现在如何解决容量不足的问题了。

考虑这样的情况，如果用户大量地调用put方法，在这种情况下，如果容量不变，那么势必会出现大量的冲突，调用get方法时，可能需要很长长度的遍历才能得到答案，性能损失严重，因此，我们可以发现put(key,value)源码中有这样一种方法doubleCapacity(),这个方法在HashMap存储容量到达阈值时调用，使得HashMap的存储容量增加一倍；

    if (size++ > threshold) {
            tab = doubleCapacity();
            index = hash & (tab.length - 1);
    }

这个方法的具体原理，有兴趣的可以去看下源码，这里我只想说一下，扩容之后，旧数组和新数组的index之前的关系：

            int highBit = e.hash & oldCapacity;
            HashMapEntry<K, V> broken = null;
            newTable[j | highBit] = e;

oldCapacity假设为16(00010000), int highBit = e.hash & oldCapacity 能够得到高位的值，因为低位全为0，经过与操作过后，低位一定是0。J 在这里是index，J 与高位的值进行‘|’操作过后，就能得到在扩容后面的新的index值。
设想一下，理论上我们得到的新的值应该是 newValue = hash & (newCapacity - 1) ，与 oldValue = hash & (oldCapacity - 1) 的区别仅在于高位上。因此我们用 J | highBit 就可以得到新的index值。

4.3.如何解决迭代问题的

4.4.HashMap 是如何实现序列化接口的

这两个问题，可以参考下面这篇文章：
http://www.woaitqs.cc/program/2015/04/14/read-source-code-about-hashmap

五、LinkedHashMap——有序的Map接口实现；

5.1

有序指的是元素可以按照插入顺序或者访问顺序排列；

既然有两种顺序选择，就需要一个标志位来确定应用中选择哪种排序方式；

LinkedHashMap成员属性boolean accessOrder就是这样一个标志位：

如果为true的话，LinkedHashMap应用访问顺序排序；

如果为false的话，LinkedHashMap应用插入顺序排序；

5.2.

LinkedHashMap内部包含一个双向循环链表，元素排序就是根据这个双向循环链表来进行的；

其数据结构示意图如下：

image

双向循环链表示意图：

image

双向循环链表头部存储的是最久访问或者最先插入的节点；
尾部存放的是最近访问或者最近插入的节点；

迭代器的遍历方向是从链表的头部开始到链表的尾部结束；

链表的头部（也可以叫尾部，叫法不一样，但不影响它的本质）有一个空的节点header；

该节点不存放key-value键值，是LinkedHashMap类的成员属性，是双向循环链表的入口；

5.3.LinkedHashMap中的双向链表的操作

示意图

image

说了这么多，都是描述性的语言，看了似乎很明白很直白，但是还是要提醒一点哦，真理还是在源码中，哈哈哈~

六、LinkedHashMap源码解析

有了HashMap的源码分析，LinkedHashMap的源码应该不难理解；
在get(key)方法中会根据访问的key来，调用makeTail(e)来调整hashMapEntry[] table中的数据顺序；

6.1.

LinkedHashMap是一个双向循环链表，它的每一个数据结点都有两个指针，分别指向直接前驱和直接后继，这一个我们可以从它的内部类LinkedEntry中看出，其定义如下：

static class LinkedEntry<K, V> extends HashMapEntry<K, V> {
        LinkedEntry<K, V> nxt;
        LinkedEntry<K, V> prv;

        /** Create the header entry */
        LinkedEntry() {
            super(null, null, 0, null);
            nxt = prv = this;
        }

        /** Create a normal entry */
        LinkedEntry(K key, V value, int hash, HashMapEntry<K, V> next,
                    LinkedEntry<K, V> nxt, LinkedEntry<K, V> prv) {
            super(key, value, hash, next);
            this.nxt = nxt;
            this.prv = prv;
        }
    }

加入一个新的节点时，执行方法，新插入的节点放置在尾部：

@Override void addNewEntry(K key, V value, int hash, int index) {
        LinkedEntry<K, V> header = this.header;

        // Remove eldest entry if instructed to do so.
        LinkedEntry<K, V> eldest = header.nxt;
        if (eldest != header && removeEldestEntry(eldest)) {
            remove(eldest.key);
        }

        // Create new entry, link it on to list, and put it into table
        LinkedEntry<K, V> oldTail = header.prv;
        LinkedEntry<K, V> newTail = new LinkedEntry<K,V>(
                key, value, hash, table[index], header, oldTail);
        table[index] = oldTail.nxt = header.prv = newTail;
    }

当accessOrder为true时，访问一个节点会执行方法makeTail()，将这个节点移动到尾部；

6.2. makeTail(e)方法

    private void makeTail(LinkedEntry<K, V> e) {
        // Unlink e
        e.prv.nxt = e.nxt;
        e.nxt.prv = e.prv;

        // Relink e as tail
        LinkedEntry<K, V> header = this.header;
        LinkedEntry<K, V> oldTail = header.prv;
        e.nxt = header;
        e.prv = oldTail;
        oldTail.nxt = header.prv = e;
        modCount++;
    }

理解makeTail()方法，直接看下面两个过程示意图：

unlink过程

image

relink过程

image

references：

http://www.cnblogs.com/chenpi/p/5294077.html

https://github.com/LittleFriendsGroup/AndroidSdkSourceAnalysis/blob/master/article/LruCache%E6%BA%90%E7%A0%81%E8%A7%A3%E6%9E%90.md

http://www.woaitqs.cc/program/2015/04/14/read-source-code-about-hashmap

最后编辑于：2017.12.09 03:10:27

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,980评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,178评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,868评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,498评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,492评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,521评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,910评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,569评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,793评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,559评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,639评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,342评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,931评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,904评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,144评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,833评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,350评论 2赞 342

LruCache原理和源码分析（一）

一、Lru算法

二、Map接口

三、HashMap——Map的实现；

3.1. HashMapEntry

3.2. put(key,value)方法

两个不同的key，计算得到index值一样时，也就是存在hash冲突时，HashMap是如何处理的？

3.3. get(key)方法

四、几个关键问题

4.1. 如何避免和解决hash冲突的

4.2.如何解决HashMap容量不足的问题

4.3.如何解决迭代问题的

4.4.HashMap 是如何实现序列化接口的

五、LinkedHashMap——有序的Map接口实现；

5.1

5.2.

5.3.LinkedHashMap中的双向链表的操作

六、LinkedHashMap源码解析

6.1.

6.2. makeTail(e)方法

推荐阅读更多精彩内容