天天看点

Java 中 equals方法和hashcode方法

此文章来自 https://www.cnblogs.com/liangjq/p/3753835.html

object对象中的 public boolean equals(Object obj),对于任何非空引用值 x 和 y,当且仅当 x 和 y 引用同一个对象时,此方法才返回 true;

注意:当此方法被重写时,通常有必要重写 hashCode 方法,以维护 hashCode 方法的常规协定,该协定声明相等对象必须具有相等的哈希码。

如下:

(1)当 obj1.equals(obj2) 为true时,obj1.hashCode() == obj2.hashCode() 必须为true .

(2)当obj1.hashCode() == obj2.hashCode()为false时,obj1.equals(obj2)必须为false 如果不重写equals,那么比较的将是对象的引用是否指向同一块内存地址,重写之后目的是为了比较两个对象的value值是否相等。

特别指出利用equals比较八大包装对象 (如int,float等)和String类(因为该类已重写了equals和hashcode方法)对象时,默认比较的是值,在比较其它自定义对象时都是比较的引用地址 hashcode是用于散列数据的快速存取,如利用HashSet/HashMap/Hashtable类来存储数据时,都是根据存储对象的hashcode值来进行判断是否相同的。 这样如果我们对一个对象重写了euqals,意思是只要对象的成员变量值都相等那么euqals就等于true,但不重写hashcode,那么我们再new一个新的对象, 当原对象.equals(新对象)等于true时,两者的hashcode却是不一样的,由此将产生了理解的不一致,如在存储散列集合时(如Set类),将会存储了两个值一样的对象, 导致混淆,因此,就也需要重写hashcode() 举例说明:

import java.util.*;  
  
public class HelloWorld {  
    public static void main(String[] args) {  
        /* 
        Collection c = new HashSet(); 
        c.add("hello"); 
        c.add(new Name("f1","l1")); 
        c.add(new Integer(100)); 
        c.remove("hello");  
        c.remove(new Integer(100)); 
        System.out.println(c.remove(new Name("f1","l1"))); 
        */  
        Name n1 = new Name("01");  
        Name n2 = new Name("01");  
          
        Collection c = new HashSet();  
        c.add(n1);  
        System.out.println("------------");  
        c.add(n2);  
        System.out.println("------------");  
        System.out.println(n1.equals(n2));  
        System.out.println("------------");  
        System.out.println(n1.hashCode());  
        System.out.println(n2.hashCode());  
        System.out.println(c);  
    }  
  
  
}  
  
class Name {  
    private String id;  
    public Name(String id) {  
        this.id = id;   
    }  
      
    public String toString(){  
        return this.id;  
    }  
    public boolean equals(Object obj) {  
        if (obj instanceof Name) {  
            Name name = (Name) obj;  
            System.out.println("equal"+ name.id);  
            return (id.equals(name.id));  
        }  
        return super.equals(obj);  
    }  
          
    public int hashCode() {  
        Name name = (Name) this;  
        System.out.println("Hash" + name.id);  
        return id.hashCode();  
              
    }  
}  

           

就这个程序进行分析,在第一次添加时,调用了hashcode()方法,将hashcode存入对象中,第二次也一样,然后对hashcode进行比较。hashcode也只用于HashSet/HashMap/Hashtable类存储数据,所以会用于比较,需要重写

总结,自定义类要重写equals方法来进行等值比较,自定义类要重写compareTo方法来进行不同对象大小的比较,重写hashcode方法为了将数据存入HashSet/HashMap/Hashtable类时进行比较

Java 重写hashCode() 时为什么要用 31 来计算

https://www.oschina.net/question/82993_75533

偶然的机会看到了大神的一篇博客,介绍的是hashCode()方法里为什么要用31这个数字作为生成hashCode的乘数。hashCode我在比较自定义类时曾经用到过 - 由于java默认比较的是类的地址值,每个对象一定是不同的,所以重写了hashCode()和equals()方法

,这样就会先根据类里的属性生成hashCode,如果生成的hashCode值相同,则在使用equals()比较属性的值。两者都相同则认为这两个对象相等。当是就对hashCode的生成很好奇,自己看了下源码也是懵懵懂懂。这下终于可以搞清楚了,开森,感谢大佬!

hashCode()方法的源码:

public static int hashCode (Object a[]) {
	if (a == null)
		return 0;
	
	int result = 1;

	for (Object element : a)
		result = 31 * result + (element == null ? 0 : element.hashCode());

	reteurn result;
}
           

原因一:更少的乘积结果冲突

  31是质子数中一个“不大不小”的存在,如果你使用的是一个如2的较小质数,那么得出的乘积会在一个很小的范围,很容易造成哈希值的冲突。而如果选择一个100以上的质数,得出的哈希值会超出int的最大范围,这两种都不合适。而如果对超过 50,000 个英文单词(由两个不同版本的 Unix 字典合并而成)进行 hash code 运算,并使用常数 31, 33, 37, 39 和 41 作为乘子,每个常数算出的哈希值冲突数都小于7个(国外大神做的测试),那么这几个数就被作为生成hashCode值得备选乘数了。

原因二:31可以被JVM优化

  JVM里最有效的计算方式就是进行位运算了:

  • 左移 << : 左边的最高位丢弃,右边补全0(把 << 左边的数据*2的移动次幂)。
  • 右移 >> : 把>>左边的数据/2的移动次幂。
  • 无符号右移 >>> : 无论最高位是0还是1,左边补齐0。
    所以 : 31 * i = (i << 5) - i(左边  31*2=62,右边   2*2^5-2=62) - 两边相等,JVM就可以高效的进行计算啦。。。