天天看點

為什麼 HashMap 并發時會引起死循環?

今天研讀Java并發容器和架構時,看到為什麼要使用ConcurrentHashMap時,其中有一個原因是:線程不安全的HashMap, HashMap在并發執行put操作時會引起死循環,是因為多線程會導緻HashMap的Entry連結清單形成環形資料結構,查找時會陷入死循環。

糾起原因看了其他的部落格,都比較抽象,是以這裡以圖形的方式展示一下,希望支援!

1)當往HashMap中添加元素時,會引起HashMap容器的擴容,原理不再解釋,直接附源代碼,如下:

/** 
* 
* 往表中添加元素,如果插入元素之後,表長度不夠,便會調用resize方法擴容 
*/  
void addEntry(int hash, K key, V value, int bucketIndex) {  
Entry<K,V> e = table[bucketIndex];  
   table[bucketIndex] = new Entry<K,V>(hash, key, value, e);  
   if (size++ >= threshold)  
       resize(2 * table.length);  
}  

/** 
* resize()方法如下,重要的是transfer方法,把舊表中的元素添加到新表中
*/  
void resize(int newCapacity) {  
   Entry[] oldTable = table;  
   int oldCapacity = oldTable.length;  
   if (oldCapacity == MAXIMUM_CAPACITY) {  
       threshold = Integer.MAX_VALUE;  
       return;  
   }  

   Entry[] newTable = new Entry[newCapacity];  
   transfer(newTable);  
   table = newTable;  
   threshold = (int)(newCapacity * loadFactor);  
}        

2)參考上面的代碼,便引入到了transfer方法,(引入重點)這就是HashMap并發時,會引起死循環的根本原因所在,下面結合transfer的源代碼,說明一下産生死循環的原理,先列transfer代碼(這是裡JDK7的源偌),如下:

/**
 * Transfers all entries from current table to newTable.
 */
void transfer(Entry[] newTable, boolean rehash) {
    int newCapacity = newTable.length;
    for (Entry<K,V> e : table) {

        while(null != e) {
            Entry<K,V> next = e.next;            ---------------------(1)
            if (rehash) {
                e.hash = null == e.key ? 0 : hash(e.key);
            }
            int i = indexFor(e.hash, newCapacity); 
            e.next = newTable[i];
            newTable[i] = e;
            e = next;
        } // while

    }
}      

3)假設:

Map<Integer> map = new HashMap<Integer>(2);  // 隻能放置兩個元素,其中的threshold為1(表中隻填充一個元素時),即插入元素為1時就擴容(由addEntry方法中得知)
//放置2個元素 3 和 7,若要再放置元素8(經hash映射後不等于1)時,會引起擴容      

假設放置結果圖如下:

為什麼 HashMap 并發時會引起死循環?

現在有兩個線程A和B,都要執行put操作,即向表中添加元素,即線程A和線程B都會看到上面圖的狀态快照

執行順序如下:

執行一: 線程A執行到transfer函數中(1)處挂起(transfer函數代碼中有标注)。此時線上程A的棧中

e = 3
next = 7      

執行二:線程B執行 transfer函數中的while循環,即會把原來的table變成新一table(線程B自己的棧中),再寫入到記憶體中。如下圖(假設兩個元素在新的hash函數下也會映射到同一個位置)

為什麼 HashMap 并發時會引起死循環?

執行三:線程A解挂,接着執行(看到的仍是舊表),即從transfer代碼 1)處接着執行,目前的 e = 3, next = 7, 上面已經描述。

1.處理元素 3 , 将 3 放入 線程A自己棧的新table中(新table是處于線程A自己棧中,是線程私有的,不肥線程2的影響),處理3後的圖如下:

為什麼 HashMap 并發時會引起死循環?

2.線程A再複制元素 7 ,目前 e = 7 ,而next值由于線程 B 修改了它的引用,是以next 為 3 ,處理後的新表如下圖

為什麼 HashMap 并發時會引起死循環?

3.由于上面取到的next = 3, 接着while循環,即目前處理的結點為3, next就為null ,退出while循環,執行完while循環後,新表中的内容如下圖:

為什麼 HashMap 并發時會引起死循環?

4.當操作完成,執行查找時,會陷入死循環!

原文連結:

https://blog.csdn.net/zhuqiuhui/article/details/51849692

版權聲明:本文為CSDN部落客「bboyzqh」的原創文章,遵循CC 4.0 BY-SA版權協定,轉載請附上原文出處連結及本聲明。