Java并發容器篇

前言

斷斷續續一個多月，也寫了十幾篇原創文章，感覺真的很不一樣；

不能說技術有很大的進步，但是想法确實跟以前有所不同；

還沒開始的時候，想着要學的東西太多，總覺得無從下手；

但是當你真正下定決心去做了幾天後，就會發現原來路真的是一步步走出來的;

如果總是原地踏步東張西望，對自己不會有幫助；

好了，下面開始今天的話題，并發容器篇

簡介

前面我們介紹了同步容器，它的很大一個缺點就是在高并發下的環境下，性能差；

針對這個，于是就有了專門為高并發設計的并發容器類；

因為并發容器類都位于java.util.concurrent下，是以我們也習慣把并發容器簡稱為JUC容器;

相對應的還有JUC原子類、JUC鎖、JUC工具類等等（這些後面再介紹）

今天就讓我們簡單來了解下JUC中并發容器的相關知識點

文章如果有問題，歡迎大家批評指正，在此謝過啦

正文

1. 什麼是并發容器

并發容器是針對高并發專門設計的一些類，用來替代性能較低的同步容器

常見的并發容器類如下所示：

這節我們主要以第一個ConcurrentHashMap為例子來介紹并發容器

其他的以後有空會單獨開篇分析

2. 為什麼會有并發容器

其實跟同步容器的出現的道理是一樣的：

同步容器是為了讓我們在編寫多線程代碼時，不用自己手動去同步加鎖，為我們解放了雙手，去做更多有意義的事情（有意義？雙手？）；

而并發容器則又是為了提高同步容器的性能，相當于同步容器的更新版；

這也是為什麼Java一直在被人唱衰，卻又一直沒有衰退的原因（大佬們也很焦慮啊！！！）;

不過話說回來，大佬們焦慮地有點過頭了；不敢想Java現在都升到16級了，而我們始終還在8級徘徊。

3. 并發容器、同步容器、普通容器的差別

這裡的普通容器，指的是沒有同步和并發的容器類，比如HashMap

三個對比着來介紹，這樣會更加清晰一點

下面我們分别以HashMap, HashTable, ConcurrentHashMap為例來介紹

性能分析

下面我們來分析下他們三個之間的性能差別：

注：這裡普通容器用的是單線程來測試的，因為多線程不安全，是以我們就不考慮了

有的朋友可能會說，你這不公平啊，可是沒辦法呀，誰讓她多線程不安全呢。

如果非要讓我在安全和性能之間選一個的話，那我選 ConcurrentHashMap（我都要）

他們三個之間的關系,如下圖

（紅色表示堵的厲害，橙色表示堵的一般，綠色表示暢通）

可以看到：

在單線程中操作普通容器時，代碼都是串行執行的，同一時刻隻能put或get一個資料到容器中
在多線程中操作同步容器時，可以多個線程排隊去執行，同一時刻也是隻能put或get一個資料到同步容器中
在多線程中操作并發容器時，可以多個線程同時去執行，也就是說同一時刻可以有多個線程去put或get多個資料到并發容器中(可同時讀讀，可同時讀寫，可同時寫寫-有可能會阻塞，這裡是以ConcurrentHashMap為參考)

下面我們用代碼來複現下上面圖中所示的效果（慢-中-快）

HashMap 測試方法

public static void hashMapTest(){
  Mapmap = new HashMap<>();  long start = System.nanoTime();	// 建立10萬條資料 單線程
  for (int i = 0; i < 100_000; i++) {		// 用UUID作為key,保證key的唯一
    map.put(UUID.randomUUID().toString(), String.valueOf(i));
    map.get(UUID.randomUUID().toString());
  }  long end = System.nanoTime();
  System.out.println("hashMap耗時：");
  System.out.println(end - start);
}複制代碼

HashTable 測試方法

public static void hashTableTest(){
  Mapmap = new Hashtable<>();  long start = System.nanoTime();	// 建立10個線程 - 多線程
  for (int i = 0; i < 10; i++) {    new Thread(()->{      // 每個線程建立1萬條資料
      for (int j = 0; j < 10000; j++) {        // UUID保證key的唯一性
        map.put(UUID.randomUUID().toString(), String.valueOf(j));
        map.get(UUID.randomUUID().toString());
      }
    }).start();
  }	// 這裡是為了等待上面的線程執行結束，之是以判斷>2，是因為在IDEA中除了main thread，還有一個monitor thread
  while (Thread.activeCount()>2){
    Thread.yield();
  }  long end = System.nanoTime();
  System.out.println("hashTable耗時：");
  System.out.println(end - start);
}複制代碼

concurrentHashMap 測試方法

public static void concurrentHashMapTest(){
  Mapmap = new ConcurrentHashMap<>();  long start = System.nanoTime();  // 建立10個線程 - 多線程
  for (int i = 0; i < 10; i++) {    new Thread(()->{      // 每個線程建立1萬條資料
      for (int j = 0; j < 10000; j++) {        // UUID作為key，保證唯一性
        map.put(UUID.randomUUID().toString(), String.valueOf(j));
        map.get(UUID.randomUUID().toString());
      }
    }).start();
  }	// 這裡是為了等待上面的線程執行結束，之是以判斷>2，是因為在IDEA中除了main thread，還有一個monitor thread
  while (Thread.activeCount()>2){
    Thread.yield();
  }  long end = System.nanoTime();
  System.out.println("concurrentHashMap耗時：");
  System.out.println(end - start);
}複制代碼

main 方法分别執行上面的三個測試

public static void main(String[] args) {
  hashMapTest();
  hashTableTest();  while (Thread.activeCount()>2){
    Thread.yield();
  }
  concurrentHashMapTest();
}複制代碼

運作可以看到，如下結果（運作多次，數值可能會變好，但是規律基本一緻）

hashMap耗時：754699874 (慢)
hashTable耗時：609160132（中）
concurrentHashMap耗時：261617133(快)複制代碼

結論就是，正常情況下的速度：普通容器 < 同步容器 < 并發容器

但是也不那麼絕對，因為這裡插入的key都是唯一的，是以看起來正常一點

那如果我們不正常一點呢？比如極端到BT的那種

下面我們就不停地插入同一條資料，上面的所有put/get都改為下面的代碼：

map.put("a", "a");
map.get("a");複制代碼

運作後，你會發現，又是另外一個結論（大家感興趣的可以敲出來試試）

不過結論不結論的，意義不是很大；

鎖分析

普通容器沒鎖

同步容器中鎖的都是方法級别，也就是說鎖的是整個容器，我們先來看下HashTable的鎖

public synchronized V put(K key, V value) {}public synchronized V remove(Object key) {}複制代碼

可以看到：因為鎖是内置鎖，鎖住的是整個容器

是以我們在put的時候，其他線程都不能put/get

而我們在get的時候，其他線程也都不能put/get

是以同步容器的效率會比較低

并發容器，我們以1.7的ConcurrentHashMap為例來說下（之是以選1.7，是因為它裡面涉及的内容都是前面章節介紹過的）

它的鎖粒度很小，它不會給整個容器上鎖，而是分段上鎖；

分段的依據就是key.hash，根據不同的hash值映射到不同的段（預設16個段），然後插入資料時，根據這個hash值去給對應的段上鎖，此時其他段還是可以被其他線程讀寫的；

是以這就是文章開頭所說的，為啥ConcurrentHashMap會支援多個線程同時寫（因為隻要插入的key的hashCode不會映射到同一個段裡，那就不會沖突，此時就可以同時寫）

讀因為沒有上鎖，是以當然也支援同時讀

如果讀操作沒有鎖，那麼它怎麼保證資料的一緻性呢？

答案就是以前介紹過的volatile（保證可見性、禁止重排序），它修飾在節點Node和值val上，保證了你get的值永遠是最新的

下面是ConcurrentHashMap部分源碼，可以看到val和net節點都是volatile類型

static class Node<K,V> implements Map.Entry<K,V> {  final int hash;  final K key;  volatile V val;  volatile Nodenext;
}複制代碼

總結下來就是：并發容器ConcurrentHashMap中，多個線程可同時讀，多個線程可同時寫，多個線程同時讀和寫

總結

什麼是并發容器：并發容器是針對高并發專門設計的一些類，用來替代性能較低的同步容器
為什麼會有并發容器：為了提高同步容器的性能
并發容器、同步容器、普通容器的差別：

性能：高 - 中 - 低
鎖：粒度小 - 粒度大 - 無
場景：高并發 - 中并發 - 單線程

參考内容：

《Java并發程式設計實戰》
《實戰Java高并發》
《深入了解Java虛拟機》

後記

我這裡介紹的都是比較淺的東西，其實并發容器的知識深入起來有很多；

但是因為這節是并發系列的比較靠前的，還有很多東西沒涉及到，是以就分析地比較淺；

Java并發容器篇

簡介

目錄

正文

1. 什麼是并發容器

2. 為什麼會有并發容器

3. 并發容器、同步容器、普通容器的差別

性能分析

鎖分析

總結

後記

繼續閱讀

RPC、ORB、MOM三類中間件比較

java并發程式設計的藝術-Java記憶體模型

java.util.concurrent.atomic詳解

Executor和線程池

CompletableFutureCompletableFuture

Java并發之Fork-Join架構詳解

Java并發程式設計藝術 9 Java中的線程池

線程間通信-java并發程式設計的藝術volatile synchroized

競态條件和臨界區競态條件和臨界區

Java并發1——線程建立、啟動、生命周期與線程控制

減少上下文切換實戰

Java并發程式設計之線程池的關閉

Thread.Start()方法運作多線程

Java多線程建立與運作

Java 知識點總結之Java 并發 API（二）

JAVA并發程式設計之基本概念