HashMap由哪些数据结构维持?
查看HashMap源码可知存放key-value的是一个Node<K,V>对象数组,Node内有4个成员变量,key,value,hash,nextNode。nextNode可能是一个普通的Node,那么此时它就是一个链表,也可能是Node的子类TreeNode,一个红黑树,即HashMap的数据结构实际上是由数组、链表、红黑树来维持。
为什么不使用List<Node<K,V>>来存放key-value数据?
如果使用list,插入的时候需要遍历所有Node,判断node的key是否存在。取出的时候也需要从头遍历直到遇到相同的key,才会停止。
而HashMap中Node数组,插入的下标位置是与key的hashcode有关。
HashMap如何存放key-value?
一般hashcode值常常超过数组大小size值,所以就要把hashcode转为二进制取二进制的后几位,具体算法是将hashcode二进制值位与运算&(size-1),(这个算法的前提是size只能是2的n次方大小,这样size-1的二进制值就为0111111...)但是为了尽可能地将node存放在不同数组下标位置上,hashMap中优化后的算法如下:
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
通过这个算法得出的hash值即为node中的hash,而存放在数组中位置即为hash&(size-1)。
即使有算法优化,hash还是会出现相同,此时就会把这个要存放的node作为起始位置node的nextNode,形成链表结构。为了防止链表无限延伸导致存取node的复杂度变高,当链表延伸个数等于8时,此时链表结构将转换为红黑树treeNode。而红黑树的节点小于等于6时则会转回链表结构(发生场景:hashMap扩容后会拆分链表和红黑树,此时可能会发生)。
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length; //resize()方法会初始化数组,或扩容数组
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k)))) //相同key,则替换node对象
e = p;
else if (p instanceof TreeNode) //node为treeNode,则作为红黑树存放
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else { //作为链表存放
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st //链表长度为8时转为红黑树
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount; //修改计数器
if (++size > threshold) //大于数组大小的0.75倍时开始扩容
resize();
afterNodeInsertion(evict);
return null;
}
HashMap如何进行扩容的?
前文说到数组大小要保持2的n次方大小,此时直接位运算左移1位对数组扩容。
然后根据新的size大小计算下标存放在相应位置,有链表结构和红黑树结构的即nextNode不为空的node会进行拆分。拆分规则算法是hash值与原size位与&运算不为0,为0的数组下标不变,不为0的数组下标为原下标+原数组长度。原因是运算不为0的hash根据新数组大小重新计算下标等于原下标+原数组长度。
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof HashMap.TreeNode)
((HashMap.TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
HashMap.Node<K,V> loHead = null, loTail = null;
HashMap.Node<K,V> hiHead = null, hiTail = null;
HashMap.Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}