HashMap在JDK1.8的重构

参考（感谢以下大佬）：
http://blog.csdn.net/qq_27093465/article/details/52207135
http://blog.csdn.net/u011392897/article/details/57105709
http://www.cnblogs.com/ygj0930/p/6543350.html
http://blog.csdn.net/u011392897/article/details/57115818
http://blog.csdn.net/u011392897/article/details/60141790
http://blog.csdn.net/u011392897/article/details/60149314
https://coolshell.cn/articles/9606.html
https://www.cnblogs.com/woshimrf/p/hashmap.html
https://blog.csdn.net/qq_27093465/article/details/52207135
https://blog.csdn.net/hzw05103020/article/details/47207787
https://github.com/crossoverJie/Java-Interview/blob/master/MD/HashMap.md

JDK1.7的HashMap

以下基于 JDK1.7 分析。

初始化

image

如图所示，HashMap 底层是基于数组和链表实现的。其中有两个重要的参数：

容量
负载因子

容量的默认大小是 16，负载因子是 0.75，当 HashMap 的 size > 16*0.75 时就会发生扩容resize(容量和负载因子都可以自由调整)。

//扩容判断值
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);//0.75*16
threshold = newThr;

//容量大于阀值，触发resize
if (++size > threshold)
            resize();

//新建数组
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];

//后续是利用头插法，将旧值赋值到新的数组去

put 方法

首先会将传入的 Key 做 hash 运算计算出 hashcode,然后根据数组长度取模计算出在数组中的 index 下标。

(由于在计算中位运算比取模运算效率高的多，所以 HashMap 规定数组的长度为 2^n 。这样用 2^n - 1 做位运算与取模效果一致，并且效率还要高出许多。参考：https://blog.csdn.net/Feifan_Feimeng/article/details/71006015)

//源码
if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
//先获取长度：(tab = resize()).length
//再算出index：tab[i = (n - 1) & hash]

由于数组的长度有限，所以难免会出现不同的 Key 通过运算得到的 index 相同，这个就是hash冲突。

(这种情况可以利用链表来解决，HashMap 会在 table[index]处形成链表，采用头插法将数据插入到链表中。如：head --> 3 --> 7 --> 5)

get 方法

get 和 put 类似，也是将传入的 Key 计算出 index ，如果该位置上是一个链表就需要遍历整个链表，通过 key.equals(k) 来找到对应的元素。(注意：这里使得HashMap的性能下降，从O(1)变成O(n))

遍历方法

 Iterator<Map.Entry<String, Integer>> entryIterator = map.entrySet().iterator();
        while (entryIterator.hasNext()) {
            Map.Entry<String, Integer> next = entryIterator.next();
            System.out.println("key=" + next.getKey() + " value=" + next.getValue());
        }

Iterator<String> iterator = map.keySet().iterator();
        while (iterator.hasNext()){
            String key = iterator.next();
            System.out.println("key=" + key + " value=" + map.get(key));

        }

map.forEach((key,value)->{
    System.out.println("key=" + key + " value=" + value);
});

强烈建议使用第一种 EntrySet 进行遍历。

第一种可以把 key value 同时取出；
第二种还得需要通过 key 取一次 value，效率较低,；
第三种需要 JDK1.8 以上，通过外层遍历 table，内层遍历链表或红黑树。

缺点

缺点1：数据量大的时候导致频繁扩容，效率降低
缺点2：数据量大的时候，hash取模冲突导致链表过长，O(1)变成O(n)
缺点3：线程不安全，会出现循环链表导致线程死循环

JDK1.8中HashMap的改进

针对上述的HashMap的三个缺点，JDK1.8该如何解决?

1.扩容效率低怎么办？

没解决！

新版的依然是：容量的默认大小是 16，负载因子是 0.75，达到阀值依然执行resize()。
依然是新增一个数组，损耗依然存在！

2.hash取模冲突导致链表过长，O(1)变成O(n)怎么办？

//Node链表的容量大于8的时候，触发使用红黑树存储
static final int TREEIFY_THRESHOLD = 8;
if (binCount >= TREEIFY_THRESHOLD - 1)
                treeifyBin(tab, hash);

//不用链表存储了，用红黑树存储
     /**
     * Replaces all linked nodes in bin at index for given hash unless
     * table is too small, in which case resizes instead.
     */
    final void treeifyBin(Node<K,V>[] tab, int hash) {
        int n, index; Node<K,V> e;
        if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
            resize();
        else if ((e = tab[index = (n - 1) & hash]) != null) {
            TreeNode<K,V> hd = null, tl = null;
            do {
                TreeNode<K,V> p = replacementTreeNode(e, null);
                if (tl == null)
                    hd = p;
                else {
                    p.prev = tl;
                    tl.next = p;
                }
                tl = p;
            } while ((e = e.next) != null);
            if ((tab[index] = hd) != null)
                hd.treeify(tab);
        }
    }

Node中链表长度大于8，就转成红黑树存储了，当然旧数据也会放到红黑树里面。
同时，最差速度到达了O(log(n))，快了！

3.线程不安全，会出现循环链表导致线程死循环怎么办？

官方的回复是：线程安全请使用ConcurrentHashMap，HashMap本身就是线程不安全的。

但是虽然HashMap依然是线程不安全，但是1.8将不会出现死循环的情况了。原因如下：

1.7中扩容，复制数组使用的是头插法，原本1-2-3的链表会变成3-2-1，所以多线程下容易出现2-3和3-2的情况导致死循环，在查询一个不存在的key时，死循环没办法跳出导致CPU100%！！！
1.8的扩容中，使用的是尾插法，因此哪怕是多线程下，也不会出现死循环。

4.解决了1.7中Hash攻击导致的CPU100%

参考：
https://www.cnblogs.com/stevenczp/p/7028071.html
https://blog.csdn.net/zly9923218/article/details/51656920
https://coolshell.cn/articles/6424.html

首先我们需要知道的是：

Java的hash算法是“非随机的”，是固定的，而且是弱化的，容易相同！

比如：

Aa和BB这两个字符串的hash code(或hash key) 是一样的！
同理，我们就可以通过这两个种子生成更多的拥有同一个hash key的字符串：”AaAa”, “AaBB”, “BBAa”, “BBBB”，“AaAaBBBB”...

System.out.println("AaAaAaAa".hashCode());
System.out.println("AaAaBBBB".hashCode());

-540425984
-540425984

相同的hash值意味着相同的index，那么在hashMap中就是会建立N长的链表
因此：JDK1.7中会有Hash Collision DoS的攻击，链表无限长，循环进行equal的时候损耗极大，以至于CPU100%！

JDK1.8中针对Hash攻击做了处理！

public class Person implements Comparable<Person>{
    private String firstName;
    private String lastName;
    private UUID id;
    public Person(String firstName, String lastName, UUID id) {
        this.firstName = firstName;
        this.lastName = lastName;
        this.id = id;
    }
    @Override
    public int hashCode() {
        return 5;
    }

    @Override
    public int compareTo(Person o) {
        return this.id.compareTo(o.id);
    }
    // ...
}

@Test
    public void hashMap1_8() throws IllegalAccessException, NoSuchMethodException, InvocationTargetException {

        int LIMIT = 500_000;
            Person person = null;
            Map<Person, String> map = new HashMap<>();

            for (int i=0;i<LIMIT;i++) {
                UUID randomUUID = UUID.randomUUID();
                person = new Person("fn", "ln", randomUUID);
                map.put(person, "comment" + i);
            }
            long start = System.currentTimeMillis();
            map.get(person);
            long stop = System.currentTimeMillis();
            System.out.println(stop-start+" millis");
    }

上述代码在1.8的测试下，加了Comparable接口的情况下，get/set的速度得到了极大的提升！

但是如果不加Comparable接口，1.8下将会触发自己的对比判断，而这个判断是比较对象类型和hashcode，所以会降低速度，但是不会像JDK1.7那样导致链表过长而引起的CPU100%。

参考：https://blog.csdn.net/weixin_42340670/article/details/80673127

if ((kc == null &&
  (kc = comparableClassFor(k)) == null) ||
   (dir = compareComparables(kc, k, pk)) == 0)
  dir = tieBreakOrder(k, pk);

总结如下：
JDK1.7 + 大量hash冲突的情况下：导致CPU100%
JDK1.8 + 大量hash冲突的情况下 + 实现Comparable接口：get/set速度极快，500万下冲突数据都能在毫秒级别响应
JDK1.8 + 大量hash冲突的情况下+ 不实现Comparable接口：get/set速度很慢，因为冲突多会执行内部实现的对比代码，导致get/set速度降低，但是不会像JDK1.7那样导致链表过长而引起CPU100%。

最后编辑于：2018.10.17 19:15:43

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 196,099评论 5赞 462
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 82,473评论 2赞 373
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 143,229评论 0赞 325
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 52,570评论 1赞 267
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 61,427评论 5赞 358
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 46,335评论 1赞 273
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 36,737评论 3赞 386
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 35,392评论 0赞 254
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 39,693评论 1赞 294
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 34,730评论 2赞 312
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 36,512评论 1赞 326
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 32,349评论 3赞 314
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 37,750评论 3赞 299
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,017评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 30,290评论 1赞 251
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 41,706评论 2赞 342
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 40,904评论 2赞 335