詳解equals()方法和hashCode()方法

Java的基類Object提供了一些方法，其中equals()方法用于判斷兩個對象是否相等，hashCode()方法用于計算對象的哈希碼。equals()和hashCode()都不是final方法，都可以被重寫(overwrite)。

本文介紹了2種方法在使用和重寫時，一些需要注意的問題。

如果覺得文章對你有幫助，歡迎點贊或轉載。文章有疏漏之處，歡迎批評指正。

一、equal()方法

二、hashCode()方法

　　1、Object的hashCode()

　　2、hashCode()的作用

三、String中equals()和hashCode()的實作

四、如何重寫hashCode()

　　1、重寫hashcode()的原則

　　2、hashCode()重寫方法

Object類中equals()方法實作如下：

通過該實作可以看出，Object類的實作采用了區分度最高的算法，即隻要兩個對象不是同一個對象，那麼equals()一定傳回false。

雖然我們在定義類時，可以重寫equals()方法，但是有一些注意事項；JDK中說明了實作equals()方法應該遵守的約定：

（1）自反性：x.equals(x)必須傳回true。

（2）對稱性：x.equals(y)與y.equals(x)的傳回值必須相等。

（3）傳遞性：x.equals(y)為true，y.equals(z)也為true，那麼x.equals(z)必須為true。

（4）一緻性：如果對象x和y在equals()中使用的資訊都沒有改變，那麼x.equals(y)值始終不變。

（5）非null：x不是null，y為null，則x.equals(y)必須為false。

Object類中hashCode()方法的聲明如下：

可以看出，hashCode()是一個native方法，而且傳回值類型是整形；實際上，該native方法将對象在記憶體中的位址作為哈希碼傳回，可以保證不同對象的傳回值不同。

與equals()方法類似，hashCode()方法可以被重寫。JDK中對hashCode()方法的作用，以及實作時的注意事項做了說明：

（1）hashCode()在哈希表中起作用，如java.util.HashMap。

（2）如果對象在equals()中使用的資訊都沒有改變，那麼hashCode()值始終不變。

（3）如果兩個對象使用equals()方法判斷為相等，則hashCode()方法也應該相等。

（4）如果兩個對象使用equals()方法判斷為不相等，則不要求hashCode()也必須不相等；但是開發人員應該認識到，不相等的對象産生不相同的hashCode可以提高哈希表的性能。

總的來說，hashCode()在哈希表中起作用，如HashSet、HashMap等。

當我們向哈希表(如HashSet、HashMap等)中添加對象object時，首先調用hashCode()方法計算object的哈希碼，通過哈希碼可以直接定位object在哈希表中的位置(一般是哈希碼對哈希表大小取餘)。如果該位置沒有對象，可以直接将object插入該位置；如果該位置有對象(可能有多個，通過連結清單實作)，則調用equals()方法比較這些對象與object是否相等，如果相等，則不需要儲存object；如果不相等，則将該對象加入到連結清單中。

這也就解釋了為什麼equals()相等，則hashCode()必須相等。如果兩個對象equals()相等，則它們在哈希表(如HashSet、HashMap等)中隻應該出現一次；如果hashCode()不相等，那麼它們會被散列到哈希表的不同位置，哈希表中出現了不止一次。

實際上，在JVM中，加載的對象在記憶體中包括三部分：對象頭、執行個體資料、填充。其中，對象頭包括指向對象所屬類型的指針和MarkWord，而MarkWord中除了包含對象的GC分代年齡資訊、加鎖狀态資訊外，還包括了對象的hashcode；對象執行個體資料是對象真正存儲的有效資訊；填充部分僅起到占位符的作用, 原因是HotSpot要求對象起始位址必須是8位元組的整數倍。

String類中相關實作代碼如下：

通過代碼可以看出以下幾點：

1、String的資料是final的，即一個String對象一旦建立，便不能修改；形如String s = "hello"; s = "world";的語句，當s = "world"執行時，并不是字元串對象的值變為了"world"，而是建立了一個String對象，s引用指向了新對象。

2、String類将hashCode()的結果緩存為hash值，提高性能。

3、String對象equals()相等的條件是二者同為String對象，長度相同，且字元串值完全相同；不要求二者是同一個對象。

4、String的hashCode()計算公式為：s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]

關于hashCode()計算過程中，為什麼使用了數字31，主要有以下原因：

1、使用質數計算哈希碼，由于質數的特性，它與其他數字相乘之後，計算結果唯一的機率更大，哈希沖突的機率更小。

2、使用的質數越大，哈希沖突的機率越小，但是計算的速度也越慢；31是哈希沖突和性能的折中，實際上是實驗觀測的結果。

3、JVM會自動對31進行優化：31 * i == (i << 5) - i

本節先介紹重寫hashCode()方法應該遵守的原則，再介紹通用的hashCode()重寫方法。

通過前面的描述我們知道，重寫hashCode需要遵守以下原則：

（1）如果重寫了equals()方法，檢查條件“兩個對象使用equals()方法判斷為相等，則hashCode()方法也應該相等”是否成立，如果不成立，則重寫hashCode ()方法。

（2）hashCode()方法不能太過簡單，否則哈希沖突過多。

（3）hashCode()方法不能太過複雜，否則計算複雜度過高，影響性能。

《Effective Java》中提出了一種簡單通用的hashCode算法

A、初始化一個整形變量，為此變量賦予一個非零的常數值，比如int result = 17;

B、選取equals方法中用于比較的所有域（之是以隻選擇equals()中使用的域，是為了保證上述原則的第1條），然後針對每個域的屬性進行計算：

(1) 如果是boolean值，則計算f ? 1:0

(2) 如果是byte\char\short\int,則計算(int)f

(3) 如果是long值，則計算(int)(f ^ (f >>> 32))

(4) 如果是float值，則計算Float.floatToIntBits(f)

(5) 如果是double值，則計算Double.doubleToLongBits(f)，然後傳回的結果是long,再用規則(3)去處理long,得到int

(6) 如果是對象應用，如果equals方法中采取遞歸調用的比較方式，那麼hashCode中同樣采取遞歸調用hashCode的方式。否則需要為這個域計算一個範式，比如當這個域的值為null的時候，那麼hashCode 值為0

(7) 如果是數組，那麼需要為每個元素當做單獨的域來處理。java.util.Arrays.hashCode方法包含了8種基本類型數組和引用數組的hashCode計算，算法同上。

C、最後，把每個域的散列碼合并到對象的哈希碼中。

下面通過一個例子進行說明。在該例中，Person類重寫了equals()方法和hashCode()方法。因為equals()方法中隻使用了name域和age域，是以hashCode()方法中，也隻計算name域和age域。

對于String類型的name域，直接使用了String的hashCode()方法；對于int類型的age域，直接用其值作為該域的hash。

詳解equals()方法和hashCode()方法

繼續閱讀

Java小案例——随機數猜測随機數猜測

nginx location中斜線的位置的重要性

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的簡單使用

neo4j之cypher使用文檔

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

mybatis_入門程式Mybatis入門

AOP程式設計_Android優雅權限架構(1)概念基礎，2021金三銀四前言正文大綱正文

GridView終極用法(一)

Effective Java 8:通用程式設計

OOM三種類型

工廠模式-三種類型

【遞歸】高效率求2的n次幂

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method