深入了解HashMap的底层原理

各位java开发的同学肯定对HashMap并不陌生，它是一种非常常见的数据结构，可是大家真的对它十分了解吗？知道它底层设计的原型和思路吗？

什么是HashMap
HashMap是一个存储K-V键值对的集合，每一个键值对叫做Entry。这些键值对存储在一个数组当中，这个数组就是HashMap的主要组成部分。
使用HashMap主要的方法有两个Put()和Get()。
1.Put方法的原理
当调用Put方法时需要使用Hash函数来确定Entry在数组中的位置（index）
index=Hash("XX")
假设index是0，则把“XX”放到数组的第一个位置上。
但是如果随着数据的不断增多，就很容易出现相同的index，这样就需要通过使用链表来解决index冲突的问题。因此HashMap数组的每一个元素既是一个Entry对象也是链表的头节点。每一个Entry对象通过Next指针指向它的下一个Entry节点。这样如果index再冲突的时候，只需要插入到对应的链表下即可。
2.Get方法原理
使用Get方法时传入key来获取value时，同样会使用Hash函数对key做一次hash映射，得到对应的index，通过index去数组对应的位置上取第一个值和key做比较，如果不是想要的key则顺着链表取下一个值，直到得到正确的结果。
为什么老是说HashMap是线程不安全的
HashMap的容量是有限的，在经过多次元素的插入后，key的hash映射发生冲突的几率就逐渐提高。这个时候就需要扩展HashMap的长度，也就是进行Resize。
Resize的步骤
1.扩容
扩容就是创建一个新的Entry空数组，长度是原来数组的两倍。
2.ReHash
ReHash的时候会首先遍历原来的数组，把原来数组所有的Entry重新Hash到新的数组中。为啥需要把以前的Entry重新Hash一遍呢，因为在数组的长度增加后，Hash的规则也相应发生变化。
此时如果此HashMap达到了Resize的临界值，而同时有多个线程在对此HashMap做插入操作时就有可能使HashMap的链表出现环形链表，程序就会进入死循环（具体出现环形链表的条件比较苛刻，而且流程非常烧脑）。
线程安全的ConcurrentHashMap
ConcurrentHashMap是HashMap的升级版，同时兼顾了线程安全和运行的效率。
ConcurrentHashMap的设计包含了一个非常重要的数据结构Segment
1.什么是Segment
Segment本身就是一个HashMap对象，Segment包含一个HashEntry数组，数组中的每一个HashEntry既是一个键值对，也是链表的头结点。
2.ConcurrentHashMap设计的好处
每一个Segment都相当于一个自治区，读和写高度自治，每一个Segment之间互不影响。每一个Segment的写入是上锁的，因此对同一个Segment的并发写入会被阻塞。这样既保证了线程安全又降低了锁的粒度，使并发操作的效率更高。
3.ConcurrentHashMap具体的读写流程
Get()方法
（1）：为输入的Key做Hash运算，得到hash值。
（2）：通过hash值，定位到对应的Segment对象。
（3）：再次通过hash值，定位到Segment当中数组的具体位置。
Put()方法
（1）：为输入的Key做Hash运算，得到hash值。
（2）：通过hash值，定位到对应的Segment对象
（3）：再次通过hash值，定位到Segment当中数组的具体位置。
（4）：插入或覆盖HashEntry对象。
（5）：释放锁。

最后编辑于：2019.06.21 19:32:35