第二篇文章主要讲解 hashCode 方法,分为以下部分:
- 关于 hashCode
- hashCode 源码
- 重写 hashCode 原因
- 如何重写 hashCode
关于 hashCode
Java中的集合(Collection)有两类,一类是 List,再有一类是 Set。前者集合内的元素是有序的,元素可以重复;后者元素无序,但元素不可重复。
两个元素是否重复应该依据什么来判断呢?
答案是 equals 方法。如果每增加一个元素就检查一次,在集合类的元素较少时,执行效率还算不错,但是那么当元素很多时,后添加到集合中的元素比较的次数就非常多了。也就是说,如果集合中现在已经有 1000 个元素,那么第 1001 个元素加入集合时,它就要调用 1000 次 equals 方法。这显然会大大降低效率。
一般情况下,计算机存储数据时,将数据连续地存储在内存单元中,于是,Java集合类在存储数据时,引进了hashCode方法,它采用了一种称为哈希算法,即将数据通过特定算法指定到某个内存单元。
当集合要添加新的元素时,先调用这个元素的hashCode方法,就一下子能定位到它应该放置的物理位置上。如果这个位置上没有元素,它就可以直接存储在这个位置上,不用再进行任何比较了;如果这个位置上已经有元素了,就调用它的 equals 方法与新元素进行比较,相同的话就不存了,不相同就散列其它的地址。所以这里存在一个冲突解决的问题。这样一来实际调用 equals 方法的次数就大大降低了,几乎只需要一两次。
所以,Java 对于 eqauls 方法和 hashCode 方法是这样规定的:
1.如果两个对象相同,那么它们的 hashCode 值一定要相同;
2.如果两个对象的 hashCode 相同,它们并不一定相同(这里说的对象相同指的是用 eqauls 方法比较)。
- equals() 相等的两个对象,hashCode() 一定相等;equals() 不相等的两个对象,却并不能证明他们的 hashCode() 不相等。
注: 规定 2 中指的是两个对象在哈希存储时发生了冲突。
hashCode 源码
public native int hashCode();
hashCode() 是一个本地方法,返回这个对象的哈希值,默认是返回该对象的内存地址。重写此方法可以提高哈希结构的集合的性能。
重写 hashCode 原因
对于 Java 集合类,我们经常使用 Set 集合来保存相关对象,而 Set 集合是不允许重复的。在向 HashSet 集合中添加元素时,其实只要重写 equals() 这一条也可以。但当 HashSet 中元素比较多时,或者是重写的 equals() 方法比较复杂时,我们只用 equals() 方法进行比较判断,效率也会非常低,所以引入了 hashCode() 这个方法,只是为了提高效率,且这是非常有必要的。
简单来说,hashCode存在的意义主要是提供查找的快捷性,比如说在Hashtable、HashMap中等。hashCode是用来在散列存储结构中确定对象存储的位置的;
如何重写 hashCode
重写 hashCode 所要遵循的原则如下:
- 在程序执行期间,只要 equals 方法的比较操作用到的信息没有被修改,那么对这同一个对象调用多次,hashCode 方法必须始终如一地返回同一个整数
- 如果两个对象通过 equals 方法比较得到的结果是相等的,那么对这两个对象进行hashCode得到的值应该相同
- 两个不同的对象,hashCode 的结果可能是相同的,这就是哈希表中的冲突。为了保证哈希表的效率,哈希算法应尽可能的避免冲突
下面介绍如何来重写hashCode()方法。通常重写hashCode()方法按以下设计原则实现。
- 把某个非零素数,例如17,保存在int型变量result中。
- 对于对象中每一个关键域f(指equals方法中考虑的每一个域)参照以下原则处理。
- boolean型,计算(f?0:1)。
- byte、char和short型,计算(int)f。
- long型,计算(int)(f^(f>>32))。
- float型,计算Float.floatToIntBits(f)。
- double型,计算Double.doubleToLongBits(f)得到一个long,再执行long型的处理。
- 对象引用,递归调用它的hashCode()方法。
- 数组域,对其中的每个元素调用它的hashCode()方法。
- 将上面计算得到的散列码保存到int型变量c,然后执行result = 37 * result + c,并返回。
根据上面的理解,我们进行相关测试。
Person类的 hashCode 重写如下:
@Override
public int hashCode() {
int result = 17;
result = 37 * result + name.hashCode();
return result;
}
Employee类的 hashCode 重写如下:
@Override
public int hashCode() {
int result = 17;
result = 37 * result + super.hashCode();
result = 37 * result + id;
return result;
}
测试类 HashCodeTest 源码如下:
public class HashCodeTest {
public static void main(String[] args) {
Employee e1 = new Employee("Mary", 18);
Employee e2 = new Employee("Mary", 19);
Person p1 = new Person("Mary");
Person p2 = new Person("Mary");
System.out.println("p1.equals(e1)'s rsult:" + p1.equals(e1));
System.out.println("p1.equals(e2)'s rsult:" + p1.equals(e2));
System.out.println("e1.equals(e2)'s rsult:" + e1.equals(e2));
System.out.println("p1.equals(p2)'s rsult:" + p1.equals(p2));
System.out.println("p1.hashCode is :" + p1.hashCode());
System.out.println("p2.hashCode is :" + p2.hashCode());
System.out.println("e1.hashCode is :" + e1.hashCode());
System.out.println("e2.hashCode is :" + e2.hashCode());
}
}
测试结果如下:
p1.equals(e1)'s rsult:false
p1.equals(e2)'s rsult:false
e1.equals(e2)'s rsult:false
p1.equals(p2)'s rsult:true
p1.hashCode is :2391408
p2.hashCode is :2391408
e1.hashCode is :88505387
e2.hashCode is :88505388
即 equals() 相等的两个对象,hashcode() 一定相等。创建一个类时,我们需要重写该类的 equals 和 hashCode 方法,若不对其进行重写,则会默认为 Object 类的 equals 和 hashCode 方法。