前言
hashCode
和equals
常常在面试中会被问到,在工作中我们也有可能遇到要重写对象equals
方法的情况,而且hashCode
方法的设计思想值得我们学习,所以我们有必要去深入学习一下这两个方法。
下面我就以面试问答的形式学习我们的——hashcode
和equals
方法(源码分析基于JDK8)
问答内容
1.
问:hashCode
方法有了解过吗?这个方法有什么用?
答:从JAVA官方对hashCode
方法的说明定义(定义在示例代码中),我们可以得知hashCode
的作用有如下几点:
hashCode
的存在主要用于查找的快捷性,如Hashtable
,HashMap
等,hashCode
是用来在散列存储结构中确定对象的存储地址的。如果两个对象相同,就是适用于equals(java.lang.Object) 方法,那么这两个对象的hashCode一定要相同。
如果对象的equals方法被重写,那么对象的hashCode也尽量重写,并且产生hashCode使用的对象,一定要和equals方法中使用的一致,否则就会违反上面提到的第2点。
两个对象的hashCode相同,并不一定表示两个对象就相同,也就是不一定适用于equals(java.lang.Object) 方法,只能够说明这两个对象在散列存储结构中,如Hashtable,他们“存放在同一个篮子里”。
1.hashcode是用来查找的,如果你学过数据结构就应该知道,在查找和排序这一章有
例如内存中有这样的位置
0 1 2 3 4 5 6 7
而我有个类,这个类有个字段叫ID,我要把这个类存放在以上8个位置之一,
如果不用hashcode而任意存放,那么当查找时就需要到这八个位置里挨个去找,或者用二分法一类的算法。
但如果用hashcode那就会使效率提高很多。
我们这个类中有个字段叫ID,那么我们就定义我们的hashcode为ID%8,
然后把我们的类存放在取得得余数那个位置。比如我们的ID为9,
9除8的余数为1,那么我们就把该类存在1这个位置,
如果ID是13,求得的余数是5,那么我们就把该类放在5这个位置。
这样,以后在查找该类时就可以通过ID除 8求余数直接找到存放的位置了。
2.但是如果两个类有相同的hashcode怎么办那(我们假设上面的类的ID不是唯一的),
例如9除以8和17除以8的余数都是1,那么这是不是合法的,
回答是:可以这样。那么如何判断呢?在这个时候就需要定义 equals了。
也就是说,我们先通过 hashcode来判断两个类是否存放某个桶里,
但这个桶里可能有很多类,那么我们就需要再通过 equals 来在这个桶里找到我们要的类。
那么。重写了equals(),为什么还要重写hashCode()呢?
想想,你要在一个桶里找东西,你必须先要找到这个桶啊,
你不通过重写hashcode()来找到桶,光重写equals()有什么用啊
上述回答转载于:Java中hashCode的作用 由于作者总结的太好,所以直接转载了
示例代码:
package java.lang;
public class Object {
·······
/**
* 返回该对象的哈希码值。
* 支持此方法是为了提高哈希表(例如 java.util.Hashtable 提供的哈希表)的性能
* {@link java.util.HashMap}.
* <p>
* hashCode 的常规协定是:
* <ul>
* <li>在 Java 应用程序执行期间,在对同一对象多次调用 hashCode 方法时,
* 必须一致地返回相同的整数,前提是将对象进行 equals 比较时所用的信息没有被修改。
* 从某一应用程序的一次执行到同一应用程序的另一次执行,该整数无需保持一致。
* <li>如果根据 equals(Object) 方法,两个对象是相等的,
* 那么对这两个对象中的每个对象调用 hashCode 方法都必须生成相同的整数结果。
* <li>如果根据 equals(java.lang.Object) 方法,两个对象不相等,
* 那么对这两个对象中的任一对象上调用 hashCode 方法不 要求一定生成不同的整数结果。
* 但是,程序员应该意识到,为不相等的对象生成不同整数结果可以提高哈希表的性能。
* </ul>
* <p>
* 实际上,由 Object 类定义的 hashCode 方法确实会针对不同的对象返回不同的整数。
* (这一般是通过将该对象的内部地址转换成一个整数来实现的,
* 但是 JavaTM 编程语言不需要这种实现技巧。)
*
* @return 此对象的一个哈希码值。
* @see java.lang.Object#equals(java.lang.Object)
* @see java.lang.System#identityHashCode
*/
public native int hashCode();
·······
}
2.
问:谈谈你对equals(Object obj)
方法的理解,它和 ==
操作符相比,有什么区别?
答:
A.==
操作符分为两种情况:
比较基础类型(byte,short,int,long,float,double,char,boolean)时,比较的是值是否相等
比较对象,比较的是对象在内存中的空间地址是否相等。
B.equals(Object obj)
方法比较也分为两种情况:
如果一个类没有重写
equals(Object obj)
方法,则等价于通过==
比较两个对象,即比较的是对象在内存中的空间地址是否相等。如果重写了
equals(Object obj)
方法,则根据重写的方法内容去比较相等,返回true
则相等,false
则不相等。
3.
问:那如果要您去重写equals(Object obj)
方法,您会怎么做?重写的过程需要注意什么?
答:我们在重写equals(Object obj)
方法,需要遵守JAVA官方的通用约定(详细请看示例代码),约定简述:
自反性:对于非 null 的对象 x,必须有 x.equals(x)=true;
对称性:如果 x.equals(y)=true,那么 y.equals(x) 必须也为true;
传递性:如果 x.equals(y)=true 而且 y.equals(z)=true,那么x.equals(z) 必须为true;
对于非 null 的对象 x,一定有x.equals(null)=false
当
equals(Object obj)
方法被重写时,通常有必要重写 hashCode 方法,以维护 hashCode 方法的常规协定,该协定声明相等对象必须具有相等的哈希码。
根据上述约定,我们可以按如下步骤重写equals(Object obj)
:
1). 先使用 ==
操作符判断两个对象的引用地址是否相同。
2). 使用instanceof
来判断 两个对象的类型是否一致。
3). 如果类型相同,则把待比较参数转型,逐一比较两个对象内部的值是否一致,全部一致才返回true
,否则返回false
。
4). 重写hashCode
方法,确保相等的两个对象必须具有相等的哈希码。
- 我们在重写一个类的
hashCode
方法时,最好是将所有用于相等性检查的字段都进行hashCode
计算,最后将所有hashCode
值相加,得出最终的hashCode
,这样可以保证hashCode生成均匀,不容易产生碰撞。
常见数据类型hashcode计算方式如下(参考自JDK源码):
重要字段var的类型 | hash运算 |
---|---|
byte,short,int,char | (int)var |
long | (int)(var ^ (var >>> 32)) |
float | Float.floatToIntBits(var) |
double | long bits = Double.doubleToLongBits(var);分量 = (int)(bits ^ (bits >>> 32)); |
引用类型 | (null == var ? 0 : var.hashCode()) |
示例代码:
/**
* 指示其他某个对象是否与此对象“相等”。
* <p>
* equals 方法在非空对象引用上实现相等关系:
* <ul>
* <li>自反性:对于任何非空引用值 x,x.equals(x) 都应返回 true。
*
* <li>对称性:对于任何非空引用值 x 和 y,当且仅当 y.equals(x) 返回 true 时,
* x.equals(y) 才应返回 true。
*
* <li>传递性:对于任何非空引用值 x、y 和 z,如果 x.equals(y) 返回 true,
* 并且 y.equals(z) 返回 true,那么 x.equals(z) 应返回 true。
*
* <li>一致性:对于任何非空引用值 x 和 y,多次调用 x.equals(y) 始终返回
* true 或始终返回 false,前提是对象上 equals 比较中所用的信息没有被修改。
*
* <li>对于任何非空引用值 x,x.equals(null) 都应返回 false。
* </ul>
*
* <p>
* Object 类的 equals 方法实现对象上差别可能性最大的相等关系;
* 即,对于任何非空引用值 x 和 y,当且仅当 x 和 y 引用同一个对象时,
* 此方法才返回 true(x == y 具有值 true)。
*
* <p>
* 注意:当此方法被重写时,通常有必要重写 hashCode 方法,
* 以维护 hashCode 方法的常规协定,该协定声明相等对象必须具有相等的哈希码。
*
* @param 要与之比较的引用对象。
* @return 如果此对象与 obj 参数相同,则返回 true;否则返回 false。
* @see #hashCode()
* @see java.util.HashMap
*/
public boolean equals(Object obj) {
return (this == obj);
}
4.
问:如果需要您去维护一个类的hash散列表,如何设计,如何解决hash冲突?
答:我们在设计类的hash散列表时,不能保证每个元素的hash值都是不一样的,这样就会造成hash冲突。解决hash冲突有如下4种方法:
开发定址法:既然当前位置容不下冲突的元素了,那就再找一个空的位置存储 Hash 冲突的值(当前 index 冲突了,那么将冲突的元素放在 index+1)。
再散列法:换一个 Hash 算法再计算一个 hash 值,如果不冲突了就存储值(例如第一个算法是名字的首字母的 Hash 值,如果冲突了,计算名字的第二个字母的 Hash 值,如果冲突解决了则将值放入数组中)。
链地址法:每个数组中都存有一个单链表,发生 Hash 冲突时,只是将冲突的 value 当作新节点插入到链表(HashMap 解决冲突的办法)。
公共溢出区法:将冲突的 value 都存到另外一个顺序表中,查找时如果当前表没有对应值,则去溢出区进行顺序查找。
总结
- 当你真要的需要重写
equals
方法,这两点一定要记住:
A.如果两个对象相等(equals() 返回 true),那么它们的 hashCode()一定要相同;
B.如果两个对象hashCode()相等,它们并不一定相等(equals() 不一定返回 true)。
如果重写的
equals
方法但不重写hashCode
,都是耍流氓,会有意想不到的结果。重写
hashCode
方法时,尽可能将所有用于相等比较的参数都参与hashCode的计算。建立hash散列表的意义就是在于,提高查询效率,当数据量大时,尤为显著。
参考文章:
Java中hashCode的作用
如何正确实现 Java 中的 HashCode
Java 的 equals 与 hashcode 对比分析
程序员必须搞清的概念equals和=和hashcode的区别
Android 面试准备之「equals 和 == 」