HashMap:
底层是基于哈希表算法;
是非线程安全的,只适用于单线程环境下,多线程环境下客采用concurrent并发包下的concurrentHashMap;
实现了serializable接口,支持序列化,实现了Cloneable接口,能被克隆.
存储数据过程:
内部维护了一个存储数据的Entry数组,HashMap采用链表解决冲突,每一个Entry本质上是一个单向链表.
当准备添加一个key-value对时,首先通过hash(key)方法计算hash值,然后通过indexFor(hash,length)求该键值对的存储位置,当计算出的位置相同时,由于存入位置是一个链表,则把这个键值对插入链头.(为保证每一个键值对都能存入HashMap中,计算方法会先用hash&0x7FFFFFFF后,在对length取模)
HashMap中key和value都允许为null,key为null的键值对永远放在table[0]为投建点的链表中.
HashMap共有四个构造方法.构造方法中有两个重要的参数:初始容量和加载因子,这两个参数是影响HashMap性能的重要参数.
其中容量表示哈希表中槽的数量(即哈希表的长度),初始容量是创建哈希表示的容量(从构造函数中可以看出,如果不指名,默认是16).
加载因子(默认是0.75)是哈希表在其容量自动增加之前可以表达到多满的一种尺度,当哈希表的条目数超出了加载因子当前容量的乘积时,则要对该哈希表进行resize操作(即扩容).
根据源码addEntry()方法可知,每次加入键值对时,都要判断当前已用的槽的数目是否大于等于阀值(容量*加载因子),如果大等于则进行扩容,将容量扩容为原来容量的两倍.
HashMap和HashTable的区别:
1.继承的父类不同
HashMap继承自AbstractMap类,而HashTable继承自Dictionary类,但二者都实现了Map接口.
2.线程安全性不同
HashTable中的方法时synchronized的,而HashMap中的方法在缺省情况下是非Synchronized的.
HashMap为何线程不安全:
因为底层是一个Entry数组,当发生hash冲突的时候,HashMap是采用链表的方式来解决的,在对应的数组位置存放链表的头结点,对链表而言,新加入的节点会从头结点加入.
3.是否提供contains方法(contains()方法是判断字符串中是否有子字符串)
HashTable保留了contains,containsValue和ContaiinsKey三个方法,其中contains和containsValue功能相同;
HashMap把HashTable的contains方法取掉了,改成containsValue和ContaiinsKey.
4.key和value是否允许null空值
HashTable中key和value都不允许null值.
HashMap中编译可以通过put(null,null),因为key和value都是Object类型,但运行时会抛出NullPointerExection异常.
(HashMap中,null可以作为键,这样的键只有一个;可以有一个或多个键所对应的值为null。当get()方法返回null值时,可能是 HashMap中没有该键,也可能使该键所对应的值为null。因此,在HashMap中不能由get()方法来判断HashMap中是否存在某个键, 而应该用containsKey()方法来判断)
5.两个遍历方式的内部实现不同
HashTable和HashMap都使用了Iterator,但HashTable还使用了Enumeration的方式.
6.hash值不同
HashTable直接使用了对象的hashCode,而HashMap重新计算了Hash值.
7.内部实现使用的数组初始化和扩容方式不同
HashTable在不指定容量的情况下默认容量为11,不要求底层数组的容量一定要为2的整数次幂.
HashMap的默认容量是16,扩容时将容量变为原来的2倍,要求底层数组容量一定是2的整数次幂.