Java集合-HashMap源码实现深入解析

原创作品,转载请注明出处。

概述

本文学习知识点

1.HashMap的存储结构怎么实现,它有什么特点。
2.HashMap的工作原理。
3.put和get方法实现源码分析。
4.hash值有什么作用?如何进行hash?equals和hashCode方法有什么作用?
5.何谓负载因子,有什么作用?
6.何时会触发扩容,以及如何扩容?

    Map<String, String> map = new HashMap<String, String>();
    map.put("liuyi", "刘一");
    map.put("wanger", "王二");
    map.put("zhangsan", "张三");
    map.put("lisi", "李四");
    map.put("wangwu", "王五");
    map.put("zhaoliu", "赵六");
    map.put("chenqi", "陈七");
    map.put("yangba", "杨八");
    map.put("zhoujiu", "周九");
    for (Map.Entry<String, String> entry : map.entrySet()) {
        System.out.println(entry.getValue() + "\t" + entry.getKey());
    }

想想上面代码的输出结果是什么样?运行后,可能的结果是:

赵六 zhaoliu
刘一 liuyi
王五 wangwu
王二 wanger
陈七 chenqi
李四 lisi
周九 zhoujiu
张三 zhangsan
杨八 yangba

从这个结果可以窥探出,HashMap存储的顺序和迭代时读取的顺序不相同,并非有序存储。来看看底层如何存储,如下图为Eclipse debug时的存储结构:

调试时HashMap的存储结构

从图中来看,HashMap内部用一个table(Entry元素数组)来存储元素,索引中的每个元素又采用链表的结构进行存储,用于存储相同索引的元素。其中Entry类就是一个节点类,具有链接下一个节点的功能,内部存储了元素的key,value,hash,next引用,Entry的结构如下,采用内部类的方式实现:

内部类:元素节点Entry的结构

HashMap的特性

1.实现了Map接口,里面的方法全部被HashMap实现。
2.允许null键和null值。这点和Hashtable不同,Hashtable不允许。
3.非线程安全,这点也和Hashtable不同,Hashtable为线程安全的。
4.不保证有序,即元素的插入和读取顺序不保证一致,这一点从开始的示例程序和图就能看出来。
5.也不保证元素的顺序始终不变,在扩容时,元素的顺序会重新被打乱。

有两个参数能够影响HashMap的结构:

1.initial capacity:table的初始容量(并非存放元素节点的容量大小,仅仅是table表的大小),默认初始容量为16。
2.load factor:负载因子,用于确定table的容量达到多大比例时,对容量进行扩容的一个参数。默认值为0.75,即默认超过12个时开始扩容,扩容时,会重新计算所有元素的hash值(rehashed),以确定其在新table上的索引下标,因此,扩容会改变原有hashtable的结构,元素的顺序也会重新改变。每次扩容后,容量的大小都是原来的2倍。至于为什么默认负载因子设置为0.75,按照官方的API说法,是因为通常0.75能够在时间复杂度和空间复杂度上达到最好的平衡效果。在设置初始容量时应该考虑到所需的条目数及其加载因子,以便最大限度地减少 rehash 操作次数。

put方法的实现 JDK1.7

put方法的步骤:
1.对key的hashcode值再计算hash。
2.用计算出的hash值,与表的length求&算出索引位置。
3.如果索引碰撞,遍历链表,判断是否有key存在,若存在更新value值。(不过在JDK1.8中链表元素超过8个时,会把链表结构转换成红黑树结构存储,提高查询的性能)
4.若未碰撞,直接放入表中。
5.放入前,如果元素个数超过负载因子的比例,则进行rehash,扩容,之会插入。
6.null key的元素永远会放到index为0的链表里面。

代码实现如下:
put方法实现
插入新元素时会判断是否进行扩容,每次扩容1倍

get方法实现

步骤:
1.null key走特殊逻辑。
2.key的hashcode计算hash值。
3.hash值计算表索引。
4.遍历索引下的链表,找到就返回,找不到返回null。

get方法

hash方法的实现

如下为hash方法的实现源码:
hash方法

hash方法中:对key的hashCode值进行了异或,逻辑右移等多个操作,目的是尽量减小冲突。因为table的容量是2的幂,直接用hashcode,低位会很容易碰撞,因此做了多次移位和异或操作,保证高位和低位都参与到hash的计算中,减少碰撞。

计算下标的时候,是这样实现的(使用&位操作,而非%求余):
hash & (length - 1)
设计者认为这方法很容易发生碰撞。为什么这么说呢?不妨思考一下,在n - 1为15(0x1111)时,其实散列真正生效的只是低4bit的有效位,当然容易碰撞了。
时间复杂度:读取O(1) + O(n),1为找索引的时间,n为链表元素的个数。插入O(1)。所以,如果冲突很频繁,某些链表非常长,就会影响HashMap的读取速度。这一点在JDK1.8中进行了性能提升,链表长度超过8则改为红黑树的存储结构实现。

resize扩容实现

实现如下:
image.png

步骤:
1.创建新的table。
2.将旧table的元素重新计算hash,根据hash计算新table的索引,插入新table。
3.新table覆盖原table的引用,更新threshold值为新table * 负载因子的大小。

总结


让我们来回答几个问题,以加深对HashMap的理解:

1. 什么时候会使用HashMap?他有什么特点?

是基于Map接口的实现,存储键值对时,它可以接收null的键值,是非同步的,HashMap存储着Entry(hash, key, value, next)对象。

2. 你知道HashMap的工作原理吗?

通过put和get存储和获取对象。存储对象时,我们将K/V传给put方法时,它调用hashCode计算hash从而得到table位置,进一步存储,HashMap会根据当前table的占用情况自动调整容量(超过Load Facotr则resize为原来的2倍)。获取对象时,我们将K传给get,它调用hashCode计算hash从而得到table位置,并进一步调用equals()方法确定键值对。如果发生碰撞的时候,Hashmap通过链表将产生碰撞冲突的元素组织起来,在Java 8中,如果一个table中碰撞冲突的元素超过某个限制(默认是8),则使用红黑树来替换链表,从而提高速度。

3. 你知道get和put的原理吗?equals()和hashCode()的都有什么作用?

通过对key的hashCode()进行hashing,并计算下标( n-1 & hash),从而获得buckets的位置。如果产生碰撞,则利用key.equals()方法去链表或树中去查找对应的节点

4. 你知道hash的实现吗?为什么要这样实现?

在Java 1.8的实现中,是通过hashCode()的高16位异或低16位实现的:(h = k.hashCode()) ^ (h >>> 16),主要是从速度、功效、质量来考虑的,这么做可以在bucket的n比较小的时候,也能保证考虑到高低bit都参与到hash的计算中,同时不会有太大的开销。

5. 何时会触发扩容,以及如何扩容?

如果table超过了负载因子(默认0.75)比例的容量,则会重新resize一个原来长度两倍的HashMap,并且重新调用hash方法计算元素在新table的索引,并挨个插入。


白天在加班加点的干活,还要抽出时间成为技术知识的分享者,分享不易。
喜欢我的文章请点赞,欢迎打赏,成为我们坚持的动力。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,968评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,601评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,220评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,416评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,425评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,144评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,432评论 3 401
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,088评论 0 261
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,586评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,028评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,137评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,783评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,343评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,333评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,559评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,595评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,901评论 2 345

推荐阅读更多精彩内容