LruCache原理和源码分析(一)

一、Lru算法

Lru算法:最近最少使用算法;

算法的核心关键类是LinkedHashMap。

基本算法:将key-value键值对按照访问顺序进行排列放置,当存入的数据超过最大内存分配时,移除最久访问的数据;

所以要搞清楚LruCache的原理,首先需要研究LinkedHashMap这个类;

LinkedHashMap继承自HashMap,自然也就继承了HashMap中的众多方法,所以在研究LinkedHashMap之前,有必要去研究下LinkedHashMap的父类HashMap;

二、Map接口

Map接口,key-value集合的抽象,反映了单个的key映射着单个的value这样一种数据结构;

它的核心行为是
存入key-value,对应着put(key,value)方法和根据key来取出value,对应着get(key);
然后为了功能上的完善,还提供了其他的接口:

//清除map中的所有数据
clear();
//是否包含某个key
containsKey(key);
//是否包含某个value
containsValue(value);
//map是否为空
isEmpty()
//根据某个key来移除key-values
remove(key)

三、HashMap——Map的实现;

3.1. HashMapEntry

它是HashMap中的一个内部类,它是HashMap存储的数据单元,HashMap中的存储数组的存储单位就是HashMapEntry

        final K key;
        V value;
        final int hash;
        HashMapEntry<K, V> next;

主要有四个值,key,values,hash和next,这个next是为了解决hash冲突而设置的,当存在hash冲突时,next会链式地指向下一个HashMapEntry对象;这个具有相同table index的entry可以链式存储到table中的同一个位置;

废话不多说了,直接进入到HashMap的核心方法get(key)和put(key,value)方法;

3.2. put(key,value)方法

    public V put(K key, V value) {
        if (key == null) {
            return putValueForNullKey(value);
        }
        //根据key来计算hash值,至于为什么是Collections.secondaryHash(key)?
        //这样做只是为了使得hash分布更均匀,避免hash冲突;
        //具体来参考大神的解释:http://burtleburtle.net/bob/hash/integer.html
        int hash = Collections.secondaryHash(key);
        //这里就是要存储数据的数组,基本元素是HashMapEntry
        HashMapEntry<K, V>[] tab = table;
        //根据hash值和table的长度来计算索引index值,注意一点,计算的index值不能超过数组的索引范围
        int index = hash & (tab.length - 1);
        //这一步,需要自己品味和分析,首先抛出一个问题:如果两个不同的key,计算得到的index恰巧相同,这种情况下怎么办呢?
        //上面的问题,其实就是发生了hash冲突如何解决的问题,HashMap采用的方法是,当index值相同时,采用链式的存储方式来存储不同的key-value值
        //这么说不明白?不要着急,看下面代码,且听我来细细道来(解释废话比较多,放在代码后边,文字里叙述,免得注释过多):
        
        for (HashMapEntry<K, V> e = tab[index]; e != null; e = e.next) {
            if (e.hash == hash && key.equals(e.key)) {
                preModify(e);
                V oldValue = e.value;
                e.value = value;
                return oldValue;
            }
        }

        // No entry for (non-null) key is present; create one
        modCount++;
        if (size++ > threshold) {
            tab = doubleCapacity();
            index = hash & (tab.length - 1);
        }
        addNewEntry(key, value, hash, index);
        return null;
    }

首先处理key为null的情况,根据成员属性entryForNullKey是否为null,如果为null,则调用addNewEntryForNullKey(value)方法来对其进行赋值:

    void addNewEntryForNullKey(V value) {
        entryForNullKey = new HashMapEntry<K, V>(null, value, 0, null);
    }

这种情况不做过多的论述;

接下来,是重点哈哈哈哈~~~好像重点有点画多了哈哈哈,不过下面是重点中的重点

HashMap是通过基础的数据类型数组HashMapEntry[] table来存入key-value键值对的;
what??没有搞错把?搞了半天,HashMap是用数组来实现数据存储的??数组的使用我想大家都没有问题把》》》

当我们往HashMap中存入键值对的时候,会根据key来计算出一个int类型的hash值,然后再将这个hash值转换成table长度范围内的索引index,再将value赋值给table[index],经过这样一个过程,就实现了key-value到数组存储的转化;

两个不同的key,计算得到index值一样时,也就是存在hash冲突时,HashMap是如何处理的?

第一次得到index值时,此时的table[index]为null,所以直接存入addNewEntry(key, value, hash, index);
第二次得到index值时,此时的table[index]不为null,进入for循环,判断是不是相同的key,如果是,则存入newValue,返回oldValue;
如果不是相同的key,for循环中if条件为false,走addNewEntry(key, value, hash, index);

    //我们仔细回顾下,在执行这个方法之前,table[index]已经存入了第一次得到index时的hashMapEntryOne,
    //那么new HashMapEntry<K, V>(key, value, hash, table[index]),生成新的对象hashMapEntryTwo,它的内部成员属性next指向了hashMapEntryOne;
    //结果就是table[index]存入了hashMapEntryTwo的引用,然后hashMapEntryTwo的next又指向了hashMapEntryOne;
    //这样存在hash冲突的两个key-values键值对,就以链式数据结构,存储到了table[index]下;
    
    void addNewEntry(K key, V value, int hash, int index) {
        table[index] = new HashMapEntry<K, V>(key, value, hash, table[index]);
    }
    
    HashMapEntry(K key, V value, int hash, HashMapEntry<K, V> next) {
            this.key = key;
            this.value = value;
            this.hash = hash;
            this.next = next;
    }

3.3. get(key)方法

    public V get(Object key) {
    //首先处理key为null的情况,根据成员属性entryForNullKey的值来返回null或者entryForNullKey的value;
        if (key == null) {
            HashMapEntry<K, V> e = entryForNullKey;
            return e == null ? null : e.value;
        }

        int hash = Collections.secondaryHash(key);
        HashMapEntry<K, V>[] tab = table;
        for (HashMapEntry<K, V> e = tab[hash & (tab.length - 1)];
                e != null; e = e.next) {
            K eKey = e.key;
            if (eKey == key || (e.hash == hash && key.equals(eKey))) {
                return e.value;
            }
        }
        return null;
    }

当根据key来获取对应的value时,其实是上述过程的逆过程:
首先根据key的值来按照特定的算法计算出对应的hash值,然后将hash值转换成数组table的索引index,然后取出table[index]中存储的值hashMapEntry,依次去遍历hashMapEntry中的值(链式存储,当存在hash冲突时,可能会有多个值,依次从next中取出值),在if条件判断中比较hashMapEntry的key是否与参数key相同,相同 的话,说明当前的hashMapEntry的value是我们要取的值;
否则的话,返回null;

整个HashMap的核心就是将key映射到内部存储结构table的index的方法+HashMapEntry链式数据结构来解决hash冲突

四、几个关键问题

4.1. 如何避免和解决hash冲突的

HashMap解决hash冲突的方法:
hash复用,同一个hash值,链式地加入多个value;
即如果不同的key,计算出的table index相同的话,那么会将这些值存入table[index]中,而table[index]的值HashMapEntry为链式存储结构,可以链式的的放入多个值;

4.2.如何解决HashMap容量不足的问题

前面解决了hash冲突的问题,那么现在如何解决容量不足的问题了。

考虑这样的情况,如果用户大量地调用put方法,在这种情况下,如果容量不变,那么势必会出现大量的冲突,调用get方法时,可能需要很长长度的遍历才能得到答案,性能损失严重,因此,我们可以发现put(key,value)源码中有这样一种方法doubleCapacity(),这个方法在HashMap存储容量到达阈值时调用,使得HashMap的存储容量增加一倍;

    if (size++ > threshold) {
            tab = doubleCapacity();
            index = hash & (tab.length - 1);
    }

这个方法的具体原理,有兴趣的可以去看下源码,这里我只想说一下,扩容之后,旧数组和新数组的index之前的关系:

            int highBit = e.hash & oldCapacity;
            HashMapEntry<K, V> broken = null;
            newTable[j | highBit] = e;

oldCapacity假设为16(00010000), int highBit = e.hash & oldCapacity 能够得到高位的值,因为低位全为0,经过与操作过后,低位一定是0。J 在这里是index,J 与 高位的值进行‘|’操作过后,就能得到在扩容后面的新的index值。
设想一下,理论上我们得到的新的值应该是 newValue = hash & (newCapacity - 1) ,与 oldValue = hash & (oldCapacity - 1) 的区别仅在于高位上。 因此我们用 J | highBit 就可以得到新的index值。

4.3.如何解决迭代问题的

4.4.HashMap 是如何实现序列化接口的

这两个问题,可以参考下面这篇文章:
http://www.woaitqs.cc/program/2015/04/14/read-source-code-about-hashmap

五、LinkedHashMap——有序的Map接口实现;

5.1

有序指的是元素可以按照插入顺序或者访问顺序排列;

既然有两种顺序选择,就需要一个标志位来确定应用中选择哪种排序方式;

LinkedHashMap成员属性boolean accessOrder就是这样一个标志位:

如果为true的话,LinkedHashMap应用访问顺序排序;

如果为false的话,LinkedHashMap应用插入顺序排序;

5.2.

LinkedHashMap内部包含一个双向循环链表,元素排序就是根据这个双向循环链表来进行的;

其数据结构示意图如下:


image

双向循环链表示意图:


image

双向循环链表头部存储的是最久访问或者最先插入的节点;
尾部存放的是最近访问或者最近插入的节点;

迭代器的遍历方向是从链表的头部开始到链表的尾部结束;

链表的头部(也可以叫尾部,叫法不一样,但不影响它的本质)有一个空的节点header;

该节点不存放key-value键值,是LinkedHashMap类的成员属性,是双向循环链表的入口;

5.3.LinkedHashMap中的双向链表的操作

示意图


image

说了这么多,都是描述性的语言,看了似乎很明白很直白,但是还是要提醒一点哦,真理还是在源码中,哈哈哈~

六、LinkedHashMap源码解析

有了HashMap的源码分析,LinkedHashMap的源码应该不难理解;
在get(key)方法中会根据访问的key来,调用makeTail(e)来调整hashMapEntry[] table中的数据顺序;

6.1.

LinkedHashMap是一个双向循环链表,它的每一个数据结点都有两个指针,分别指向直接前驱和直接后继,这一个我们可以从它的内部类LinkedEntry中看出,其定义如下:

static class LinkedEntry<K, V> extends HashMapEntry<K, V> {
        LinkedEntry<K, V> nxt;
        LinkedEntry<K, V> prv;

        /** Create the header entry */
        LinkedEntry() {
            super(null, null, 0, null);
            nxt = prv = this;
        }

        /** Create a normal entry */
        LinkedEntry(K key, V value, int hash, HashMapEntry<K, V> next,
                    LinkedEntry<K, V> nxt, LinkedEntry<K, V> prv) {
            super(key, value, hash, next);
            this.nxt = nxt;
            this.prv = prv;
        }
    }

加入一个新的节点时,执行方法,新插入的节点放置在尾部:

@Override void addNewEntry(K key, V value, int hash, int index) {
        LinkedEntry<K, V> header = this.header;

        // Remove eldest entry if instructed to do so.
        LinkedEntry<K, V> eldest = header.nxt;
        if (eldest != header && removeEldestEntry(eldest)) {
            remove(eldest.key);
        }

        // Create new entry, link it on to list, and put it into table
        LinkedEntry<K, V> oldTail = header.prv;
        LinkedEntry<K, V> newTail = new LinkedEntry<K,V>(
                key, value, hash, table[index], header, oldTail);
        table[index] = oldTail.nxt = header.prv = newTail;
    }

当accessOrder为true时,访问一个节点会执行方法makeTail(),将这个节点移动到尾部;

6.2. makeTail(e)方法

    private void makeTail(LinkedEntry<K, V> e) {
        // Unlink e
        e.prv.nxt = e.nxt;
        e.nxt.prv = e.prv;

        // Relink e as tail
        LinkedEntry<K, V> header = this.header;
        LinkedEntry<K, V> oldTail = header.prv;
        e.nxt = header;
        e.prv = oldTail;
        oldTail.nxt = header.prv = e;
        modCount++;
    }

理解makeTail()方法,直接看下面两个过程示意图:

unlink过程


image

relink过程


image

references:

http://www.cnblogs.com/chenpi/p/5294077.html

https://github.com/LittleFriendsGroup/AndroidSdkSourceAnalysis/blob/master/article/LruCache%E6%BA%90%E7%A0%81%E8%A7%A3%E6%9E%90.md

http://www.woaitqs.cc/program/2015/04/14/read-source-code-about-hashmap

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,980评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,178评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,868评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,498评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,492评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,521评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,910评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,569评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,793评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,559评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,639评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,342评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,931评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,904评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,144评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,833评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,350评论 2 342

推荐阅读更多精彩内容