Java中的HashMap是怎么工作的?本文将通过自己定义HashMap的 put,get,remove的方法来简单的解释下HashMap内部的工作原理;
我们通过之前的2篇文章已经知道了,ArrayList底层操作的是数组,LinkedList的底层操作的 是链表;底层操作的数据结构不同也直接决定了他们的性能:
数组寻址简单,插入和删除困难;
链表寻址困难,插入和删除容易;
所以也导致了ArrayList和LinkedList继承了他们这些优缺点~
HashMap就是综合了这2个的特性,寻址容易,插入删除也容易的一个集合;
现在开始进入分析环节瞅瞅HashMap是如何实现这个神奇的操作的~Go
(本文针对JDK1.7源码)
HashMapEntry是HashMap的一个内部类,该内部类的作用之后慢慢道来;
接着看创建HashMap的时候构造器都干了什么?
只是简单的初始化了负载因子和HashMap的阈值;我们先来解释下HashMap中几个关键的成员变量
transient int size:HashMap实际存储的元素个数
final float loadFactor:负载因子
int threshold:阈值,也就是临界值,容量和负载因子的乘机,即下一次需要开始扩容的阈值;
transient int modCount:HashMap结构被修改的次数,在迭代器中会使用到
transient HashMapEntry[]table:HashMap底层维护的1个类型为HashMapEntry类型的数组
Put方法
当一个key需要被放到HashMap中时:
1:check下当前的数组(table)的引用是不是指向空数组,如果是,重新计算下阈值,创建1个新的数组;
2:HashMap是支持值为null的,所以先对key做null检查,如果key为null,则用该键值对生成1个HashMapEntry放到table[0]处,注意:key为null的hash值都是0,所以只能放到table[0]处,且永远最多只会有1个HashMapEntry对象,形成不了链表
3:key的值不为null,计算key的hash值,根据hash值计算得出该key应该放到table[]数组中的精确索引位置,我们叫做bucketIndex
4:得到bucketIndex的HashMapEntry对象,我们叫做桶,桶是1个单链表;
5:遍历链表,如果找到哈希值相同(也就是平常说的哈希冲突)并且对象也相同的那个节点,则将该节点的值覆盖,也就是我们平常操作的put(k,v)中存在相同的key时候,后放入的value会覆盖前面的value
6:现在有2种情况,通过bucketIndex我们得到了1个桶(单链表),分开分析2种情况
7:该桶(单链表)是空的,还为放入键值对,则直接创建1个HashMapEntry对象放入
8:该桶(单链表)不是空的,但是我们遍历了一整个链表也没有找到相同的key,则也创建1个HashMapEntry对象,添加到链表的表头;
注意:后放入的HashMapEntry对象是添加到链表表头,先放到的是在链表尾部
下面通过2张图来描述下上面的步骤:
以上就是HashMap的put过程解析,下面我们来看看Get方法是如何运作的;
Get方法:
1:如果key为null,则遍历table[0]得到HashMapEntry链表,遍历该链表取得key为null处的value即可
2:通过key找到table数组中的桶(链表),遍历该链表,找到hash值相同并且对象相同的key处对应的value即可
以上就是HashMap的Get方法,通过以上2个方法,应该对HashMap的数据结构以及如何工作的有了个了解;
下面补充点,HashMap中也存在1个table数组,凡是数组,大小都是固定的。要实现容量的改变,就涉及到扩容,而table数组的索引又是由hash值和数组大小共同决定的,所以一旦进行扩容,就涉及到数组大小的改变和数组索引的重新计算分配,也就是常说的reHash;
以上就是HashMap 的基本实现原理;