天天看點

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

來源:developer

cnblogs.com/developer_chan/p/10450908.html

  • 1.jdk1.7中的HashMap
    • 1.1 擴容造成死循環分析過程
    • 1.2 擴容造成資料丢失分析過程
  • 2.jdk1.8中HashMap
  • 總結

前言:我們都知道HashMap是線程不安全的,在多線程環境中不建議使用,但是其線程不安全主要展現在什麼地方呢,本文将對該問題進行解密。

1.jdk1.7中的HashMap

在jdk1.8中對HashMap做了很多優化,這裡先分析在jdk1.7中的問題,相信大家都知道在jdk1.7多線程環境下HashMap容易出現死循環,這裡我們先用代碼來模拟出現死循環的情況:

1 public class HashMapTest {
 2
 3     public static void main(String[] args) {
 4         HashMapThread thread0 = new HashMapThread();
 5         HashMapThread thread1 = new HashMapThread();
 6         HashMapThread thread2 = new HashMapThread();
 7         HashMapThread thread3 = new HashMapThread();
 8         HashMapThread thread4 = new HashMapThread();
 9         thread0.start();
10         thread1.start();
11         thread2.start();
12         thread3.start();
13         thread4.start();
14     }
15 }
16
17 class HashMapThread extends Thread {
18     private static AtomicInteger ai = new AtomicInteger();
19     private static Map<Integer, Integer> map = new HashMap<>();
20
21     @Override
22     public void run() {
23         while (ai.get() < 1000000) {
24             map.put(ai.get(), ai.get());
25             ai.incrementAndGet();
26         }
27     }
28 }
           

複制

上述代碼比較簡單,就是開多個線程不斷進行put操作,并且HashMap與AtomicInteger都是全局共享的。在多運作幾次該代碼後,出現如下死循環情形:

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

其中有幾次還會出現數組越界的情況:

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

這裡我們着重分析為什麼會出現死循環的情況,通過jps和jstack命名檢視死循環情況,結果如下:

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

從堆棧資訊中可以看到出現死循環的位置,通過該資訊可明确知道死循環發生在HashMap的擴容函數中,根源在transfer函數中,jdk1.7中HashMap的transfer函數如下:

1    void transfer(Entry[] newTable, boolean rehash) {
 2         int newCapacity = newTable.length;
 3         for (Entry<K,V> e : table) {
 4             while(null != e) {
 5                 Entry<K,V> next = e.next;
 6                 if (rehash) {
 7                     e.hash = null == e.key ? 0 : hash(e.key);
 8                 }
 9                 int i = indexFor(e.hash, newCapacity);
10                 e.next = newTable[i];
11                 newTable[i] = e;
12                 e = next;
13             }
14         }
15     }
           

複制

總結下該函數的主要作用:

在對table進行擴容到newTable後,需要将原來資料轉移到newTable中,注意10-12行代碼,這裡可以看出在轉移元素的過程中,使用的是頭插法,也就是連結清單的順序會翻轉,這裡也是形成死循環的關鍵點。下面進行詳細分析。

1.1 擴容造成死循環分析過程

前提條件:

這裡假設

#1.hash算法為簡單的用key mod連結清單的大小。

#2.最開始hash表size=2,key=3,7,5,則都在table[1]中。

#3.然後進行resize,使size變成4。

未resize前的資料結構如下:

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

如果在單線程環境下,最後的結果如下:

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

這裡的轉移過程,不再進行詳述,隻要了解transfer函數在做什麼,其轉移過程以及如何對連結清單進行反轉應該不難。

然後在多線程環境下,假設有兩個線程A和B都在進行put操作。線程A在執行到transfer函數中第11行代碼處挂起,因為該函數在這裡分析的地位非常重要,是以再次貼出來。

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

此時線程A中運作結果如下:

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

線程A挂起後,此時線程B正常執行,并完成resize操作,結果如下:

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

這裡需要特别注意的點:由于線程B已經執行完畢,根據Java記憶體模型,現在newTable和table中的Entry都是主存中最新值:7.next=3,3.next=null。

此時切換到線程A上,線上程A挂起時記憶體中值如下:e=3,next=7,newTable[3]=null,代碼執行過程如下:

newTable[3]=e ----> newTable[3]=3
e=next ----> e=7
           

複制

此時結果如下:

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

繼續循環:

e=7
next=e.next ----> next=3【從主存中取值】
e.next=newTable[3] ----> e.next=3【從主存中取值】
newTable[3]=e ----> newTable[3]=7
e=next ----> e=3
           

複制

結果如下:

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

再次進行循環:

e=3
next=e.next ----> next=null
e.next=newTable[3] ----> e.next=7 即:3.next=7
newTable[3]=e ----> newTable[3]=3
e=next ----> e=null
           

複制

注意此次循環:e.next=7,而在上次循環中7.next=3,出現環形連結清單,并且此時e=null循環結束。

結果如下:

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

在後續操作中隻要涉及輪詢hashmap的資料結構,就會在這裡發生死循環,造成悲劇。

1.2 擴容造成資料丢失分析過程

遵照上述分析過程,初始時:

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

線程A和線程B進行put操作,同樣線程A挂起:

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

此時線程A的運作結果如下:

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

此時線程B已獲得CPU時間片,并完成resize操作:

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

同樣注意由于線程B執行完成,newTable和table都為最新值:5.next=null。

此時切換到線程A,線上程A挂起時:e=7,next=5,newTable[3]=null。

執行newtable[i]=e,就将**7放在了table[3]**的位置,此時next=5。接着進行下一次循環:

e=5
next=e.next ----> next=null,從主存中取值
e.next=newTable[1] ----> e.next=5,從主存中取值
newTable[1]=e ----> newTable[1]=5
e=next ----> e=null
           

複制

将5放置在table[1]位置,此時e=null循環結束,3元素丢失,并形成環形連結清單。并在後續操作hashmap時造成死循環。

面試官邪魅一笑:HashMap 為什麼線程不安全?1.jdk1.7中的HashMap2.jdk1.8中HashMap總結

2.jdk1.8中HashMap

在jdk1.8中對HashMap進行了優化,在發生hash碰撞,不再采用頭插法方式,而是直接插傳入連結表尾部,是以不會出現環形連結清單的情況,但是在多線程的情況下仍然不安全,這裡我們看jdk1.8中HashMap的put操作源碼:

1  final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
 2                    boolean evict) {
 3         Node<K,V>[] tab; Node<K,V> p; int n, i;
 4         if ((tab = table) == null || (n = tab.length) == 0)
 5             n = (tab = resize()).length;
 6         if ((p = tab[i = (n - 1) & hash]) == null) // 如果沒有hash碰撞則直接插入元素
 7             tab[i] = newNode(hash, key, value, null);
 8         else {
 9             Node<K,V> e; K k;
10             if (p.hash == hash &&
11                 ((k = p.key) == key || (key != null && key.equals(k))))
12                 e = p;
13             else if (p instanceof TreeNode)
14                 e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
15             else {
16                 for (int binCount = 0; ; ++binCount) {
17                     if ((e = p.next) == null) {
18                         p.next = newNode(hash, key, value, null);
19                         if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
20                             treeifyBin(tab, hash);
21                         break;
22                     }
23                     if (e.hash == hash &&
24                         ((k = e.key) == key || (key != null && key.equals(k))))
25                         break;
26                     p = e;
27                 }
28             }
29             if (e != null) { // existing mapping for key
30                 V oldValue = e.value;
31                 if (!onlyIfAbsent || oldValue == null)
32                     e.value = value;
33                 afterNodeAccess(e);
34                 return oldValue;
35             }
36         }
37         ++modCount;
38         if (++size > threshold)
39             resize();
40         afterNodeInsertion(evict);
41         return null;
42     }
           

複制

這是jdk1.8中HashMap中put操作的主函數, 注意第6行代碼,如果沒有hash碰撞則會直接插入元素。如果線程A和線程B同時進行put操作,剛好這兩條不同的資料hash值一樣,并且該位置資料為null,是以這線程A、B都會進入第6行代碼中。假設一種情況,線程A進入後還未進行資料插入時挂起,而線程B正常執行,進而正常插入資料,然後線程A擷取CPU時間片,此時線程A不用再進行hash判斷了,問題出現:線程A會把線程B插入的資料給覆寫,發生線程不安全。

這裡隻是簡要分析下jdk1.8中HashMap出現的線程不安全問題的展現,後續将會對java的集合架構進行總結,到時再進行具體分析。

總結

首先HashMap是線程不安全的,其主要展現:

#1.在jdk1.7中,在多線程環境下,擴容時會造成環形鍊或資料丢失。

#2.在jdk1.8中,在多線程環境下,會發生資料覆寫的情況。