JDK1.7及以下HashMap并发出现死循环根因分析

问题出现条件

  1. JDK1.7及以下版本
  2. 并发使用HashMap
  3. HashMap发生resize(扩容)

总结成一句话,有多个线程并发向该HashMap中添加hash冲突的元素,直至HashMap发生扩容

HashMap初始容量

首先我们看HashMap的3种构造方法(JDK1.7):

    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);

        this.loadFactor = loadFactor;
        threshold = initialCapacity;
        init();
    }

    public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }

    /**
     * Constructs an empty <tt>HashMap</tt> with the default initial capacity
     * (16) and the default load factor (0.75).
     */
    public HashMap() {
        this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
    }

参数说明:

参数名 说明 默认值
initialCapacity HashMap的初始容量 2^4=16
loadFactor 负载因子 0.75f

我们常用的Map<K,V> map = new HashMap<>();其实是第3个构造方法,从该构造方法上方的注释可以看出,initialCapacity默认是16,loadFactor默认是0.75f。从HashMap的静态变量也可找到对应值:

loadFactor到底有什么用呢?请往下看。

HashMap何时扩容

扩容肯定发生在HashMap的塞不下的情况下,那这里面的玄机肯定藏在put方法里面:

    public V put(K key, V value) {
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key);
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }

我们看到几个关键的方法:

方法 说明
hash() 计算Key的hash值
indexFor() 计算Value在数组中存放的下标位置
addEntry() 执行插入操作

乍一看没有扩容相关的代码,其实是在倒数第二行的addEntry()方法里面(其他两个方法的分析):

    void addEntry(int hash, K key, V value, int bucketIndex) {
        if ((size >= threshold) && (null != table[bucketIndex])) {
            resize(2 * table.length);
            hash = (null != key) ? hash(key) : 0;
            bucketIndex = indexFor(hash, table.length);
        }

        createEntry(hash, key, value, bucketIndex);
    }

我们看到,如果HashMap当前size >= threshod ,且数组当前位置不为null时,会进行扩容!
其中resize(2 * table.length)可以看出,每次扩容为原来容量的2倍

我们再来看resize()方法:

    void resize(int newCapacity) {
        Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }

        Entry[] newTable = new Entry[newCapacity];
        transfer(newTable, initHashSeedAsNeeded(newCapacity));
        table = newTable;
        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
    }

我们看到,关键步骤为倒数3行和倒数1行:

  • 步骤1. transfer()方法把当前数组转换为扩容后的新数组,大小就是入参传进来的,是原来大小的2倍;
  • 步骤2. 重新计算threhold,(新容量*负载因子)与(最大容量+1)两个值取小;

对于步骤2,我们引申一下:我们看构造方法中,threhold = initialCapacity。可能大家会有疑问,说好的负载因子呢?其实在构造方法中,尚未对HashMap进行初始化,即还没有正真去创建桶。在put方法中,我们看到了inflateTable(threshold);方法,这才是初始化Map的方法,有兴趣的同学可以去研究一下。为了尽量避免resize,当你知道你最多会往HashMap塞N个对象的时候,一开始就申请N个容量的HashMap,内部会自动帮你计算转换成2的倍数。(为什么是2的倍数)。

HashMap扩容时数组转换(头插法)

接下来就是扩容的重头戏——transfer()方法:

    void transfer(Entry[] newTable, boolean rehash) {
        int newCapacity = newTable.length;
        for (Entry<K,V> e : table) {
            while(null != e) {
                Entry<K,V> next = e.next;
                if (rehash) {
                    e.hash = null == e.key ? 0 : hash(e.key);
                }
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            }
        }
    }

我们可以看到,该算法有两个主要步骤:
(TODO 什么时候需要rehash)

  1. 把当前节点的next指向链表的起始位置(即数组的下标i的地址):e.next = newTable[i];
  2. 把当前节点赋值给链表起始位置:newTable[i] = e;

该算法会倒转整个链表的顺序。这也是会出现死循环的根本原因!

下面我们举个例子并结合图例来说明:

  1. 假设我们有一个HashMap初始容量为4,目前已有3个冲突元素a,b,c在一条链上,那么该HashMap结构如下图:

  2. 在非并发情况下,继续put一个冲突元素d,则会发生resize,具体步骤如下图:

我们看到,transfer方法会把原有链表顺序倒过来,这就是jdk1.7使用的头插法。
上面的例子演示的是正常情况下,resize方法执行后,HashMap内的结构。
下面我们看并发时候为什么会出现死循环:

并发下的tranfer方法

假设我们有一个HashMap初始容量为4,目前已有3个冲突元素a,b,c在一条链上,有两个线程 T1 与 T2同时往该HashMap中插入元素。那么这个时候,两个线程同时对此HashMap执行了tranfer方法。

我们假设T2先执行到中间状态:



此状态是for循环第一次,变量e指向抵一个节点c,变量next指向e.next 也就是b,但是节点的next指向尚未发生任何改变。

这时T1也开始:



这与上文正常的transfer方法执行结果是相同的,即把链表顺序倒转。

此时线程T2继续执行transfer方法,for循环的第二次:

由于T1改变了b.next ,使得b.next指向了c;此时继续执行transfer方法,则会得到如下状态:

上图这个结构其实已经产生了死循环的条件了——a的下个节点是b,而b的下个节点是a,产生了一个环形链表

此时当我们get一个此链表的元素的时候,会用equals方法遍历判断链表元素是否一致,遍历结束条件是next为null,而环形链表会导致遍历永远无法结束,即发生了死循环!

总结

以上分析基于JDK1.7,所幸的是JDK1.8已经修复了此问题,transfer方法由头插法改为尾插法,从根源上杜绝了这种情况的发生。但是如果要在并发情况下使用Map的话,建议使用Concurrent包下的,支持并发的容器类。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,098评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,213评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,960评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,519评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,512评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,533评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,914评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,804评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,563评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,644评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,350评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,933评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,908评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,146评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,847评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,361评论 2 342

推荐阅读更多精彩内容