hashCode
- Object中的hashCode()
-
- hashCode()和equals()
- 重寫的hashCode()方法
Object中的hashCode()
hashCode方法用來傳回對象的哈希值,提供該方法是為了支援哈希表,例如HashMap,HashTable等,在Object類中的代碼如下:
這是一個native聲明的本地方法,傳回一個int型的整數。由于在Object中,是以每個對象都有一個預設的哈希值。
在openjdk8根路徑/hotspot/src/share/vm/runtime路徑下的synchronizer.cpp檔案中,有生成哈希值的代碼:
static inline intptr_t get_next_hash(Thread * Self, oop obj) {
intptr_t value = 0 ;
if (hashCode == 0) {
// 傳回随機數
value = os::random() ;
} else
if (hashCode == 1) {
//用對象的記憶體位址根據某種算法進行計算
intptr_t addrBits = cast_from_oop<intptr_t>(obj) >> 3 ;
value = addrBits ^ (addrBits >> 5) ^ GVars.stwRandom ;
} else
if (hashCode == 2) {
// 始終傳回1,用于測試
value = 1 ;
} else
if (hashCode == 3) {
//從0開始計算哈希值
value = ++GVars.hcSequence ;
} else
if (hashCode == 4) {
//輸出對象的記憶體位址
value = cast_from_oop<intptr_t>(obj) ;
} else {
// 預設的hashCode生成算法,利用xor-shift算法産生僞随機數
unsigned t = Self->_hashStateX ;
t ^= (t << 11) ;
Self->_hashStateX = Self->_hashStateY ;
Self->_hashStateY = Self->_hashStateZ ;
Self->_hashStateZ = Self->_hashStateW ;
unsigned v = Self->_hashStateW ;
v = (v ^ (v >> 19)) ^ (t ^ (t >> 8)) ;
Self->_hashStateW = v ;
value = v ;
}
value &= markOopDesc::hash_mask;
if (value == 0) value = 0xBAD ;
assert (value != markOopDesc::no_hash, "invariant") ;
TEVENT (hashCode: GENERATE) ;
return value;
}
源碼中的hashCode其實是JVM啟動的一個參數,每一個分支對應一個生成政策,通過
-XX:hashCode
可以切換hashCode的生成政策。
下面驗證第2種生成政策,用軟體
idea
輸入參數
-XX:hashCode=2
,可以看到輸出結果正是1,進而進一步驗證了上面的源碼。
hashCode()和equals()
hashCode()和equals()用來辨別對象,兩個方法協同工作用來判斷兩個對象是否相等。對象通過調用 Object.hashCode()生成哈希值,由于不可避免地會存在哈希值沖突的情況 是以hashCode 相同時 還需要再調用 equals 進行一次值的比較,但是若hashCode不同,将直接判定兩個對象不同,跳過 equals ,這加快了沖突處理效率。 Object 類定義中對 hashCode和 equals 要求如下:
- 如果兩個對象的equals的結果是相等的,則兩個對象的 hashCode 的傳回結果也必須是相同的。
- 任何時候重寫equals,都必須同時重寫hashCode。
下面看一個小例子:
import java.util.HashMap;
import java.util.Objects;
/**
* @author mazouri
* @create 2021-08-10 23:59
*/
public class Person {
//使用者Id,唯一确定使用者
private String id;
private String name;
public Person(String id, String name) {
this.id = id;
this.name = name;
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (!(o instanceof Person)) return false;
Person person = (Person) o;
return Objects.equals(id, person.id) && Objects.equals(name, person.name);
}
public static void main(String[] args) {
HashMap<Person, Integer> map = new HashMap<>();
//key:Person類型 value:Integer類型
map.put(new Person("1","張三"),100);
System.out.println(map.get(new Person("1", "張三")));
}
}
我們将Person類的執行個體作為key,value為這個對象的考試成績。我們期望通過
map.get(new Person("1", "張三"))
擷取該對象的考試成績,但上面代碼的輸出結果為
null
。原因就在于Person類中沒有覆寫
hashCode
方法,進而導緻兩個相等的執行個體具有不同的哈希值。
HashMap
中get()的核心代碼如下
if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
return first;
if條件表達式中的
e.hash == hash
是先決條件,隻有相等才會執行&&後面的代碼。equals不相等時并不強制要求哈希值相等,但是一個優秀的雜湊演算法應盡可能讓元素均勻分布,降低沖突發生的機率,即在equals不相等時盡量讓哈希值也不相等,這樣&&或||短路操作一旦生效,會極大提高程式的效率。像上面的例子,因為沒有重寫hashCode方法,兩個對象有兩個哈希值,擷取對象時可能在别的哈希桶中查找,即使湊巧在一個哈希桶,因為哈希值不一樣,也找不到原來那一個對象。
你可以根據你自己的需求設計重寫hashCode方法,或者調用JDK提供好的,比如
@Override
public int hashCode() {
return Objects.hash(id, name);
}
這樣就能解決問題,但是這個運作速度慢一些,因為它們會引發數組的建立,以便傳入數目可變的參數, 如果參數中有基本類型,還需要裝箱和拆箱 ,建議隻将這類散列函數用于不太注重性能的情況。
重寫的hashCode()方法
Java為許多常用的資料類型重寫了
hashCode()
方法,比如
String
,
Integer
,
Double
等。比如在Integer類中哈希值就是其int類型的資料。
public static int hashCode(int value) {
return value;
}
具體細節去JDK源碼中看看吧😊