前言#
今天掐指一算,果然是一个写博客的良辰吉日,所以早上来就开始准备,之前我们聊了聊哈西算法的优点和好处,并且意识到如果没有哈西表,在我们庞大的内存里面查询一个对象,是有多么的蛋疼。
例如我们常用的HashMap,把一些不在连续的内存空间的对象放在一起,这个时候你再去想遍历,那不是要蛋疼的飞起?,所以今天我们先来看看hashCode方法。
正文#
再次回忆起Java老师曾经跟我们说的话:如果要判断两个对象相等,一定要同时重写equals和hashCode方法。
老师说,同时重写才是真正意义上的相等,这个定义太抽象了,到底什么是真正意义?今天我们就老看一看。
首先看一下equals方法:
public boolean equals(Object obj) {
return (this == obj);
}
注释太长了,我就不贴了,直接简单的总结一下,想看英文的朋友可以直接去看源码:
== 这个判断符,是判断对象的内存地址是否相等,相等表示是同一个对象,而内存地址是我们无法改变的,所以简单的说equals和hashcode并没有什么卵关系,但是hashCode与内存地址可能有关系。
注释最重要的一句话:请注意,它一般是要重写hashCode方法,每当重写此方法时,以保持为相等对象必须hashCode相等的协议。
接下来再看看hashCode:
public int hashCode() {
int lockWord = shadow$_monitor_;
final int lockWordStateMask = 0xC0000000; // Top 2 bits.
final int lockWordStateHash = 0x80000000; // Top 2 bits are value 2 (kStateHash).
final int lockWordHashMask = 0x0FFFFFFF; // Low 28 bits.
if ((lockWord & lockWordStateMask) == lockWordStateHash) {
return lockWord & lockWordHashMask;
}
return System.identityHashCode(this);
}
我发现百度百科对hashCode的注释翻译的不错,就直接用了:
public int hashCode()返回该对象的哈希码值。支持此方法是为了提高哈希表(例如 java.util.Hashtable 提供的哈希表)的性能。
在 Java 应用程序执行期间,在对同一对象多次调用 hashCode 方法时,必须一致地返回相同的整数,前提是将对象进行hashcode比较时所用的信息没有被修改。
如果根据 equals(Object) 方法,两个对象是相等的,那么对这两个对象中的每个对象调用 hashCode 方法都必须生成相同的整数结果,注:这里说的equals(Object) 方法是指Object类中未被子类重写过的equals方法。如果两个hashCode()返回的结果相等,则两个对象的equals方法不一定相等。
如果根据equals(java.lang.Object)方法,两个对象不相等,那么对这两个对象中的任一对象上调用 hashCode 方法不一定生成不同的整数结果。但是,程序员应该意识到,为不相等的对象生成不同整数结果可以提高哈希表的性能。
两边都要同时重写这两个方法,相同对象hashCode必须相同,这是默认协议,这样可以提高哈希表的效率。
所以只重写equals方法,一样可以达到判断是否是同一对象的目的,但是Java要求我们必须重写相应的hashCode方法,来维持两者之间的协议,从而提高在哈希表中的效率,虽然我们可以不去遵守。
<h2>每一个对象的hashCode都是不同的吗?</h2>
这个最经典的面试题之一了,答案很明显,肯定是否定的:不同对象也可能得到相同的hashCode。
首先不讨论我们自己去重写hashCode方法出现的hashCode相同的情况,Java内部会出现这样的情况吗?
大家可以试着去运行一个例子,在两个hashMap中,放入相同的key和value,那么这两个hashMap的hashCode是相同的,所以我们看一下hashMap的hashCode源码:
public int hashCode() {
int h = 0;
Iterator<Entry<K,V>> i = entrySet().iterator();
while (i.hasNext())
h += i.next().hashCode();
return h;
}
就是把内部的HashMapEntry的hashCode累加就得到了HashMap的hashCode,我们put进去的键值对都是放在hashMapEntry中的,这个之后我们再仔细的聊,那么就去看看HashMapEntry的hashCode方法:
public final int hashCode() {
return Objects.hashCode(getKey()) ^ Objects.hashCode(getValue());
}
就是把key的hashCode和value的hashCode进行运算,得到HashCode,如果key和value的hashCode相同,那么HashMapEntry的hashCode就会相同,也就是说HashMap的hashCode也会相同。
其实从理论上我们是可以理解这种hashCode的算法的道理,既然HashMap里面的内容是完全一样的,所以使用哪一个都是无所谓的,也就是理论他们是相等,给予他们相同的HashCode也是合情合理,但是两个HashMap是不同对象,equals就会返回false。
总结#
最后来举个例子来加深一下理解,我们把hashCode看成宿舍门牌号,equals是我们具体的床位位置:
开学了,我们带着满怀激动的心情,梦想着美丽大方的学姐,来到大学宿舍报道:
首先为我分配宿舍(HashCode,室友和我相同)14号楼315房间,床位(内存地址)右上。
终于有一位身材高挑,气质美人,巨乳肥臀的学姐看上了我,准备到男生宿舍找我表白,一个一个宿舍的去找吗?别闹了,肯定不可能,所以首先她先找到我的宿舍门牌号(通过hashCode迅速定位),然后通过床位(例如四人间)上的床位卡,就可以找到我的位置了。
完美,首先我们要区别hashCode和内存地址,不要把他们当成相同的东西,hashCode仅仅是一种标识,我们尽量让他具有唯一性,但是并不保证这一点,标识可以帮助我们迅速找到他,提高查找的效率,仅此而已,如果具有相同标识有多人,之后再其他手段继续查找,例如哈希表嵌套哈希表,哈西表嵌套列表等等,总之效率才是最重要的。
ok,现在我们已经对hashCode又有了新的理解,接下来我们看看再hashMap中是如何使用hashCode的。