这一周早早的就把作业写好了,可能因为工作很闲的缘故。
首先是自我学习,学习到了HashMap的实现,基于数组加链表的处理。
有两个个很重要的点吧:
它是如何确定每一个元素的数组下标的?
1.首先通过key的hashcode()方法取得它的hashcode。
2.调用hash()函数对step1取得的hashcode进行rehash(为了避免使用一个很糟糕的hash函数,导致所有所有数据进入数组的同一个index)
3.调用indexFor()方法取得数组下标(return h & length-1),h为step2取得的值。
这里必须说明一下,为了让HashMap运行的更有效率,数组长度必须为2的幂次。这是为什么呢?想象一下长度为17,那么length-1为16,二进制为0...10000,那么h与0...10000做&运算,只能为0...00000或者0...10000即0或者16。length为17的数组,只有2个index被用到了,显然这个HashMap效率很低下。
当保持length为2的幂次时,length-1的低位全为1。比如16的二进制表示为 0...10000,那么length-1就是15,二进制为0...01111。做&运算,高位会被全部切掉(因为高位做&之后全为0了),这样做&运算之后得到的值均在0...00000—0...01111之间,即0-15,达到了取模运算(%)的效果。h的低位任何一位不同,所得到的数组下标都会发生变化。这样经过前两步取得了一个好的h值的话,经过h& length-1得到下标结果将是相当分散的。
那么为什么不直接使用取模(%)运算呢,因为位运算效率高呗。所以length为2的幂次。
它是如何自动扩容的?
对于HashMap我们是如何取值的,得到key通过上述step1.2.3得到下标,再遍历链表通过key的equals()得到值。
为何要自动扩容,因为链表只是解决散列冲突的一种方式,我们当然希望的是链表越少越好,越短越好,这样使用数组下标达到常数时间访问。
HashMap还有一个属性是负载因子(loadfactor),当size达到threshold = length*loadfactor将会自动扩容,如果length为16,loadfactor为0.75.则HashMap中元素个数达到12个时将会触发自动扩容。
那么如何扩容呢? 新建一个length*2的数组,然后遍历数组的每一项(其中还有链表),重新调用indexFor()计算下标,将旧元素传到新数组里面去。