天天看點

Java并發容器篇

前言

斷斷續續一個多月,也寫了十幾篇原創文章,感覺真的很不一樣;

不能說技術有很大的進步,但是想法确實跟以前有所不同;

還沒開始的時候,想着要學的東西太多,總覺得無從下手;

但是當你真正下定決心去做了幾天後,就會發現 原來路真的是一步步走出來的;

如果總是原地踏步東張西望,對自己不會有幫助;

好了,下面開始今天的話題,并發容器篇

簡介

前面我們介紹了同步容器,它的很大一個缺點就是在高并發下的環境下,性能差;

針對這個,于是就有了專門為高并發設計的并發容器類;

因為并發容器類都位于java.util.concurrent下,是以我們也習慣把并發容器簡稱為JUC容器;

相對應的還有JUC原子類、JUC鎖、JUC工具類等等(這些後面再介紹)

今天就讓我們簡單來了解下JUC中并發容器的相關知識點

文章如果有問題,歡迎大家批評指正,在此謝過啦

目錄

  1. 什麼是并發容器
  2. 為什麼會有并發容器
  3. 并發容器、同步容器、普通容器的差別

正文

1. 什麼是并發容器

并發容器是針對高并發專門設計的一些類,用來替代性能較低的同步容器

常見的并發容器類如下所示:

Java并發容器篇

這節我們主要以第一個ConcurrentHashMap為例子來介紹并發容器

其他的以後有空會單獨開篇分析

2. 為什麼會有并發容器

其實跟同步容器的出現的道理是一樣的:

同步容器是為了讓我們在編寫多線程代碼時,不用自己手動去同步加鎖,為我們解放了雙手,去做更多有意義的事情(有意義?雙手?);

而并發容器則又是為了提高同步容器的性能,相當于同步容器的更新版;

這也是為什麼Java一直在被人唱衰,卻又一直沒有衰退的原因(大佬們也很焦慮啊!!!);

不過話說回來,大佬們焦慮地有點過頭了;不敢想Java現在都升到16級了,而我們始終還在8級徘徊。

3. 并發容器、同步容器、普通容器的差別

這裡的普通容器,指的是沒有同步和并發的容器類,比如HashMap

三個對比着來介紹,這樣會更加清晰一點

下面我們分别以HashMap, HashTable, ConcurrentHashMap為例來介紹

性能分析

下面我們來分析下他們三個之間的性能差別:

注:這裡普通容器用的是單線程來測試的,因為多線程不安全,是以我們就不考慮了

有的朋友可能會說,你這不公平啊,可是沒辦法呀,誰讓她多線程不安全呢。

如果非要讓我在安全和性能之間選一個的話,那我選 ConcurrentHashMap(我都要)

他們三個之間的關系,如下圖

Java并發容器篇

(紅色表示堵的厲害,橙色表示堵的一般,綠色表示暢通)

可以看到:

  • 在單線程中操作普通容器時,代碼都是串行執行的,同一時刻隻能put或get一個資料到容器中
  • 在多線程中操作同步容器時,可以多個線程排隊去執行,同一時刻也是隻能put或get一個資料到同步容器中
  • 在多線程中操作并發容器時,可以多個線程同時去執行,也就是說同一時刻可以有多個線程去put或get多個資料到并發容器中(可同時讀讀,可同時讀寫,可同時寫寫-有可能會阻塞,這裡是以ConcurrentHashMap為參考)

下面我們用代碼來複現下上面圖中所示的效果(慢-中-快)

  1. HashMap 測試方法
public static void hashMapTest(){
  Mapmap = new HashMap<>();  long start = System.nanoTime();	// 建立10萬條資料 單線程
  for (int i = 0; i < 100_000; i++) {		// 用UUID作為key,保證key的唯一
    map.put(UUID.randomUUID().toString(), String.valueOf(i));
    map.get(UUID.randomUUID().toString());
  }  long end = System.nanoTime();
  System.out.println("hashMap耗時:");
  System.out.println(end - start);
}複制代碼      
  1. HashTable 測試方法
public static void hashTableTest(){
  Mapmap = new Hashtable<>();  long start = System.nanoTime();	// 建立10個線程 - 多線程
  for (int i = 0; i < 10; i++) {    new Thread(()->{      // 每個線程建立1萬條資料
      for (int j = 0; j < 10000; j++) {        // UUID保證key的唯一性
        map.put(UUID.randomUUID().toString(), String.valueOf(j));
        map.get(UUID.randomUUID().toString());
      }
    }).start();
  }	// 這裡是為了等待上面的線程執行結束,之是以判斷>2,是因為在IDEA中除了main thread,還有一個monitor thread
  while (Thread.activeCount()>2){
    Thread.yield();
  }  long end = System.nanoTime();
  System.out.println("hashTable耗時:");
  System.out.println(end - start);
}複制代碼      
  1. concurrentHashMap 測試方法
public static void concurrentHashMapTest(){
  Mapmap = new ConcurrentHashMap<>();  long start = System.nanoTime();  // 建立10個線程 - 多線程
  for (int i = 0; i < 10; i++) {    new Thread(()->{      // 每個線程建立1萬條資料
      for (int j = 0; j < 10000; j++) {        // UUID作為key,保證唯一性
        map.put(UUID.randomUUID().toString(), String.valueOf(j));
        map.get(UUID.randomUUID().toString());
      }
    }).start();
  }	// 這裡是為了等待上面的線程執行結束,之是以判斷>2,是因為在IDEA中除了main thread,還有一個monitor thread
  while (Thread.activeCount()>2){
    Thread.yield();
  }  long end = System.nanoTime();
  System.out.println("concurrentHashMap耗時:");
  System.out.println(end - start);
}複制代碼      
  1. main 方法分别執行上面的三個測試
public static void main(String[] args) {
  hashMapTest();
  hashTableTest();  while (Thread.activeCount()>2){
    Thread.yield();
  }
  concurrentHashMapTest();
}複制代碼      

運作可以看到,如下結果(運作多次,數值可能會變好,但是規律基本一緻)

hashMap耗時:754699874 (慢)
hashTable耗時:609160132(中)
concurrentHashMap耗時:261617133(快)複制代碼      
結論就是,正常情況下的速度:普通容器 < 同步容器 < 并發容器

但是也不那麼絕對,因為這裡插入的key都是唯一的,是以看起來正常一點

那如果我們不正常一點呢?比如極端到BT的那種

下面我們就不停地插入同一條資料,上面的所有put/get都改為下面的代碼:

map.put("a", "a");
map.get("a");複制代碼      

運作後,你會發現,又是另外一個結論(大家感興趣的可以敲出來試試)

不過結論不結論的,意義不是很大;

鎖分析

普通容器沒鎖

同步容器中鎖的都是方法級别,也就是說鎖的是整個容器,我們先來看下HashTable的鎖

public synchronized V put(K key, V value) {}public synchronized V remove(Object key) {}複制代碼      

可以看到:因為鎖是内置鎖,鎖住的是整個容器

是以我們在put的時候,其他線程都不能put/get

而我們在get的時候,其他線程也都不能put/get

是以同步容器的效率會比較低

并發容器,我們以1.7的ConcurrentHashMap為例來說下(之是以選1.7,是因為它裡面涉及的内容都是前面章節介紹過的)

它的鎖粒度很小,它不會給整個容器上鎖,而是分段上鎖;

分段的依據就是key.hash,根據不同的hash值映射到不同的段(預設16個段),然後插入資料時,根據這個hash值去給對應的段上鎖,此時其他段還是可以被其他線程讀寫的;

是以這就是文章開頭所說的,為啥ConcurrentHashMap會支援多個線程同時寫(因為隻要插入的key的hashCode不會映射到同一個段裡,那就不會沖突,此時就可以同時寫)

讀因為沒有上鎖,是以當然也支援同時讀

如果讀操作沒有鎖,那麼它怎麼保證資料的一緻性呢?

答案就是以前介紹過的volatile(保證可見性、禁止重排序),它修飾在節點Node和值val上,保證了你get的值永遠是最新的

下面是ConcurrentHashMap部分源碼,可以看到val和net節點都是volatile類型

static class Node<K,V> implements Map.Entry<K,V> {  final int hash;  final K key;  volatile V val;  volatile Nodenext;
}複制代碼      

總結下來就是:并發容器ConcurrentHashMap中,多個線程可同時讀,多個線程可同時寫,多個線程同時讀和寫

總結

  1. 什麼是并發容器:并發容器是針對高并發專門設計的一些類,用來替代性能較低的同步容器
  2. 為什麼會有并發容器:為了提高同步容器的性能
  3. 并發容器、同步容器、普通容器的差別:
  • 性能:高 - 中 - 低
  • 鎖:粒度小 - 粒度大 - 無
  • 場景:高并發 - 中并發 - 單線程

參考内容:

  • 《Java并發程式設計實戰》
  • 《實戰Java高并發》
  • 《深入了解Java虛拟機》

後記

我這裡介紹的都是比較淺的東西,其實并發容器的知識深入起來有很多;

但是因為這節是并發系列的比較靠前的,還有很多東西沒涉及到,是以就分析地比較淺;