天天看點

【死磕 Java 并發】—– J.U.C 之 Java并發容器:ConcurrentHashMap

  • 重要概念
  • 重要内部類
  • 構造函數
  • 初始化: initTable()
  • put操作
  • get操作
  • 擴容操作
  • 轉換紅黑樹

HashMap是我們用得非常頻繁的一個集合,但是由于它是非線程安全的,在多線程環境下,put操作是有可能産生死循環的,導緻CPU使用率接近100%。為了解決該問題,提供了Hashtable和Collections.synchronizedMap(hashMap)兩種解決方案,但是這兩種方案都是對讀寫加鎖,獨占式,一個線程在讀時其他線程必須等待,吞吐量較低,性能較為低下。故而Doug Lea大神給我們提供了高性能的線程安全HashMap:ConcurrentHashMap。

ConcurrentHashMap的實作

ConcurrentHashMap作為Concurrent一族,其有着高效地并發操作,相比Hashtable的笨重,ConcurrentHashMap則更勝一籌了。

在1.8版本以前,ConcurrentHashMap采用分段鎖的概念,使鎖更加細化,但是1.8已經改變了這種思路,而是利用CAS+Synchronized來保證并發更新的安全,當然底層采用數組+連結清單+紅黑樹的存儲結構。

關于1.7和1.8的差別請參考占小狼部落格:談談ConcurrentHashMap1.7和1.8的不同實作:http://www.jianshu.com/p/e694f1e868ec

我們從如下幾個部分全面了解ConcurrentHashMap在1.8中是如何實作的:

  1. ConcurrentHashMap的初始化
  2. size操作
  3. 擴容
  4. 紅黑樹轉換

ConcurrentHashMap定義了如下幾個常量:

// 最大容量:2^30=1073741824
private static final int MAXIMUM_CAPACITY = 1 << 30;

// 預設初始值,必須是2的幕數
private static final int DEFAULT_CAPACITY = 16;

//
static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

//
private static final int DEFAULT_CONCURRENCY_LEVEL = 16;

//
private static final float LOAD_FACTOR = 0.75f;

// 連結清單轉紅黑樹閥值,> 8 連結清單轉換為紅黑樹
static final int TREEIFY_THRESHOLD = 8;

//樹轉連結清單閥值,小于等于6(tranfer時,lc、hc=0兩個計數器分别++記錄原bin、新binTreeNode數量,<=UNTREEIFY_THRESHOLD 則untreeify(lo))
static final int UNTREEIFY_THRESHOLD = 6;

//
static final int MIN_TREEIFY_CAPACITY = 64;

//
private static final int MIN_TRANSFER_STRIDE = 16;

//
private static int RESIZE_STAMP_BITS = 16;

// 2^15-1,help resize的最大線程數
private static final int MAX_RESIZERS = (1 << (32 - RESIZE_STAMP_BITS)) - 1;

// 32-16=16,sizeCtl中記錄size大小的偏移量
private static final int RESIZE_STAMP_SHIFT = 32 - RESIZE_STAMP_BITS;

// forwarding nodes的hash值
static final int MOVED     = -1;

// 樹根節點的hash值
static final int TREEBIN   = -2;

// ReservationNode的hash值
static final int RESERVED  = -3;

// 可用處理器數量
static final int NCPU = Runtime.getRuntime().availableProcessors();
           

上面是ConcurrentHashMap定義的常量,簡單易懂,就不多闡述了。下面介紹ConcurrentHashMap幾個很重要的概念。

  1. table:用來存放Node節點資料的,預設為null,預設大小為16的數組,每次擴容時大小總是2的幂次方;
  2. nextTable:擴容時新生成的資料,數組為table的兩倍;
  3. Node:節點,儲存key-value的資料結構;
  4. ForwardingNode:一個特殊的Node節點,hash值為-1,其中存儲nextTable的引用。隻有table發生擴容的時候,ForwardingNode才會發揮作用,作為一個占位符放在table中表示目前節點為null或則已經被移動
  5. sizeCtl

    :控制辨別符,用來控制table初始化和擴容操作的,在不同的地方有不同的用途,其值也不同,所代表的含義也不同

  • 負數代表正在進行初始化或擴容操作
  • -1代表正在初始化
  • -N 表示有N-1個線程正在進行擴容操作
  • 正數或0代表hash表還沒有被初始化,這個數值表示初始化或下一次進行擴容的大小

為了實作ConcurrentHashMap,Doug Lea提供了許多内部類來進行輔助實作,如Node,TreeNode,TreeBin等等。下面我們就一起來看看ConcurrentHashMap幾個重要的内部類。

Node

作為ConcurrentHashMap中最核心、最重要的内部類,Node擔負着重要角色:key-value鍵值對。所有插入ConCurrentHashMap的中資料都将會包裝在Node中。定義如下:

static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        volatile V val;             //帶有volatile,保證可見性
        volatile Node<K,V> next;    //下一個節點的指針

        Node(int hash, K key, V val, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.val = val;
            this.next = next;
        }

        public final K getKey()       { return key; }
        public final V getValue()     { return val; }
        public final int hashCode()   { return key.hashCode() ^ val.hashCode(); }
        public final String toString(){ return key + "=" + val; }
        /** 不允許修改value的值 */
        public final V setValue(V value) {
            throw new UnsupportedOperationException();
        }

        public final boolean equals(Object o) {
            Object k, v, u; Map.Entry<?,?> e;
            return ((o instanceof Map.Entry) &&
                    (k = (e = (Map.Entry<?,?>)o).getKey()) != null &&
                    (v = e.getValue()) != null &&
                    (k == key || k.equals(key)) &&
                    (v == (u = val) || v.equals(u)));
        }

        /**  指派get()方法 */
        Node<K,V> find(int h, Object k) {
            Node<K,V> e = this;
            if (k != null) {
                do {
                    K ek;
                    if (e.hash == h &&
                            ((ek = e.key) == k || (ek != null && k.equals(ek))))
                        return e;
                } while ((e = e.next) != null);
            }
            return null;
        }
    }
           

在Node内部類中,其屬性value、next都是帶有volatile的。同時其對value的setter方法進行了特殊處理,不允許直接調用其setter方法來修改value的值。最後Node還提供了find方法來指派map.get()。

TreeNode

我們在學習HashMap的時候就知道,HashMap的核心資料結構就是連結清單。在ConcurrentHashMap中就不一樣了,如果連結清單的資料過長是會轉換為紅黑樹來處理。當它并不是直接轉換,而是将這些連結清單的節點包裝成TreeNode放在TreeBin對象中,然後由TreeBin完成紅黑樹的轉換。是以TreeNode也必須是ConcurrentHashMap的一個核心類,其為樹節點類,定義如下:

static final class TreeNode<K,V> extends Node<K,V> {
        TreeNode<K,V> parent;  // red-black tree links
        TreeNode<K,V> left;
        TreeNode<K,V> right;
        TreeNode<K,V> prev;    // needed to unlink next upon deletion
        boolean red;

        TreeNode(int hash, K key, V val, Node<K,V> next,
                 TreeNode<K,V> parent) {
            super(hash, key, val, next);
            this.parent = parent;
        }


        Node<K,V> find(int h, Object k) {
            return findTreeNode(h, k, null);
        }

        //查找hash為h,key為k的節點
        final TreeNode<K,V> findTreeNode(int h, Object k, Class<?> kc) {
            if (k != null) {
                TreeNode<K,V> p = this;
                do  {
                    int ph, dir; K pk; TreeNode<K,V> q;
                    TreeNode<K,V> pl = p.left, pr = p.right;
                    if ((ph = p.hash) > h)
                        p = pl;
                    else if (ph < h)
                        p = pr;
                    else if ((pk = p.key) == k || (pk != null && k.equals(pk)))
                        return p;
                    else if (pl == null)
                        p = pr;
                    else if (pr == null)
                        p = pl;
                    else if ((kc != null ||
                            (kc = comparableClassFor(k)) != null) &&
                            (dir = compareComparables(kc, k, pk)) != 0)
                        p = (dir < 0) ? pl : pr;
                    else if ((q = pr.findTreeNode(h, k, kc)) != null)
                        return q;
                    else
                        p = pl;
                } while (p != null);
            }
            return null;
        }
    }
           

源碼展示TreeNode繼承Node,且提供了findTreeNode用來查找查找hash為h,key為k的節點。

TreeBin

該類并不負責key-value的鍵值對包裝,它用于在連結清單轉換為紅黑樹時包裝TreeNode節點,也就是說ConcurrentHashMap紅黑樹存放是TreeBin,不是TreeNode。該類封裝了一系列的方法,包括putTreeVal、lookRoot、UNlookRoot、remove、balanceInsetion、balanceDeletion。由于TreeBin的代碼太長我們這裡隻展示構造方法(構造方法就是構造紅黑樹的過程):

static final class TreeBin<K,V> extends Node<K,V> {
        TreeNode<K, V> root;
        volatile TreeNode<K, V> first;
        volatile Thread waiter;
        volatile int lockState;
        static final int WRITER = 1; // set while holding write lock
        static final int WAITER = 2; // set when waiting for write lock
        static final int READER = 4; // increment value for setting read lock

        TreeBin(TreeNode<K, V> b) {
            super(TREEBIN, null, null, null);
            this.first = b;
            TreeNode<K, V> r = null;
            for (TreeNode<K, V> x = b, next; x != null; x = next) {
                next = (TreeNode<K, V>) x.next;
                x.left = x.right = null;
                if (r == null) {
                    x.parent = null;
                    x.red = false;
                    r = x;
                } else {
                    K k = x.key;
                    int h = x.hash;
                    Class<?> kc = null;
                    for (TreeNode<K, V> p = r; ; ) {
                        int dir, ph;
                        K pk = p.key;
                        if ((ph = p.hash) > h)
                            dir = -1;
                        else if (ph < h)
                            dir = 1;
                        else if ((kc == null &&
                                (kc = comparableClassFor(k)) == null) ||
                                (dir = compareComparables(kc, k, pk)) == 0)
                            dir = tieBreakOrder(k, pk);
                        TreeNode<K, V> xp = p;
                        if ((p = (dir <= 0) ? p.left : p.right) == null) {
                            x.parent = xp;
                            if (dir <= 0)
                                xp.left = x;
                            else
                                xp.right = x;
                            r = balanceInsertion(r, x);
                            break;
                        }
                    }
                }
            }
            this.root = r;
            assert checkInvariants(root);
        }

        /** 省略很多代碼 */
    }
           

通過構造方法是不是發現了部分端倪,構造方法就是在構造一個紅黑樹的過程。

ForwardingNode

這是一個真正的輔助類,該類僅僅隻存活在ConcurrentHashMap擴容操作時。隻是一個标志節點,并且指向nextTable,它提供find方法而已。該類也是內建Node節點,其hash為-1,key、value、next均為null。如下:

static final class ForwardingNode<K,V> extends Node<K,V> {
        final Node<K,V>[] nextTable;
        ForwardingNode(Node<K,V>[] tab) {
            super(MOVED, null, null, null);
            this.nextTable = tab;
        }

        Node<K,V> find(int h, Object k) {
            // loop to avoid arbitrarily deep recursion on forwarding nodes
            outer: for (Node<K,V>[] tab = nextTable;;) {
                Node<K,V> e; int n;
                if (k == null || tab == null || (n = tab.length) == 0 ||
                        (e = tabAt(tab, (n - 1) & h)) == null)
                    return null;
                for (;;) {
                    int eh; K ek;
                    if ((eh = e.hash) == h &&
                            ((ek = e.key) == k || (ek != null && k.equals(ek))))
                        return e;
                    if (eh < 0) {
                        if (e instanceof ForwardingNode) {
                            tab = ((ForwardingNode<K,V>)e).nextTable;
                            continue outer;
                        }
                        else
                            return e.find(h, k);
                    }
                    if ((e = e.next) == null)
                        return null;
                }
            }
        }
    }
           

ConcurrentHashMap提供了一系列的構造函數用于建立ConcurrentHashMap對象:

public ConcurrentHashMap() {
    }

    public ConcurrentHashMap(int initialCapacity) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException();
        int cap = ((initialCapacity >= (MAXIMUM_CAPACITY >>> 1)) ?
                   MAXIMUM_CAPACITY :
                   tableSizeFor(initialCapacity + (initialCapacity >>> 1) + 1));
        this.sizeCtl = cap;
    }

    public ConcurrentHashMap(Map<? extends K, ? extends V> m) {
        this.sizeCtl = DEFAULT_CAPACITY;
        putAll(m);
    }

    public ConcurrentHashMap(int initialCapacity, float loadFactor) {
        this(initialCapacity, loadFactor, 1);
    }

    public ConcurrentHashMap(int initialCapacity,
                             float loadFactor, int concurrencyLevel) {
        if (!(loadFactor > 0.0f) || initialCapacity < 0 || concurrencyLevel <= 0)
            throw new IllegalArgumentException();
        if (initialCapacity < concurrencyLevel)   // Use at least as many bins
            initialCapacity = concurrencyLevel;   // as estimated threads
        long size = (long)(1.0 + (long)initialCapacity / loadFactor);
        int cap = (size >= (long)MAXIMUM_CAPACITY) ?
            MAXIMUM_CAPACITY : tableSizeFor((int)size);
        this.sizeCtl = cap;
    }
           

ConcurrentHashMap的初始化主要由initTable()方法實作,在上面的構造函數中我們可以看到,其實ConcurrentHashMap在構造函數中并沒有做什麼事,僅僅隻是設定了一些參數而已。其真正的初始化是發生在插入的時候,例如put、merge、compute、computeIfAbsent、computeIfPresent操作時。其方法定義如下:

private final Node<K,V>[] initTable() {
        Node<K,V>[] tab; int sc;
        while ((tab = table) == null || tab.length == 0) {
            //sizeCtl < 0 表示有其他線程在初始化,該線程必須挂起
            if ((sc = sizeCtl) < 0)
                Thread.yield();
            // 如果該線程擷取了初始化的權利,則用CAS将sizeCtl設定為-1,表示本線程正在初始化
            else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
                    // 進行初始化
                try {
                    if ((tab = table) == null || tab.length == 0) {
                        int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                        @SuppressWarnings("unchecked")
                        Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                        table = tab = nt;
                        // 下次擴容的大小
                        sc = n - (n >>> 2); ///相當于0.75*n 設定一個擴容的門檻值
                    }
                } finally {
                    sizeCtl = sc;
                }
                break;
            }
        }
        return tab;
    }
           

初始化方法initTable()的關鍵就在于sizeCtl,該值預設為0,如果在構造函數時有參數傳入該值則為2的幂次方。該值如果 < 0,表示有其他線程正在初始化,則必須暫停該線程。如果線程獲得了初始化的權限則先将sizeCtl設定為-1,防止有其他線程進入,最後将sizeCtl設定0.75 * n,表示擴容的門檻值。

ConcurrentHashMap最常用的put、get操作,ConcurrentHashMap的put操作與HashMap并沒有多大差別,其核心思想依然是根據hash值計算節點插入在table的位置,如果該位置為空,則直接插入,否則插入到連結清單或者樹中。但是ConcurrentHashMap會涉及到多線程情況就會複雜很多。我們先看源代碼,然後根據源代碼一步一步分析:

public V put(K key, V value) {
        return putVal(key, value, false);
    }

    final V putVal(K key, V value, boolean onlyIfAbsent) {
        // ... 超過微信文章長度
    }
           

按照上面的源碼,我們可以确定put整個流程如下:

  • 判空;ConcurrentHashMap的key、value都不允許為null
  • 計算hash。利用方法計算hash值。
    static final int spread(int h) {
          return (h ^ (h >>> 16)) & HASH_BITS;
      }
               
  • 周遊table,進行節點插入操作,過程如下:
  • 如果table為空,則表示ConcurrentHashMap還沒有初始化,則進行初始化操作:initTable()
  • 根據hash值擷取節點的位置i,若該位置為空,則直接插入,這個過程是不需要加鎖的。計算f位置:i=(n - 1) & hash
  • 如果檢測到fh = f.hash == -1,則f是ForwardingNode節點,表示有其他線程正在進行擴容操作,則幫助線程一起進行擴容操作
  • 如果f.hash >= 0 表示是連結清單結構,則周遊連結清單,如果存在目前key節點則替換value,否則插入到連結清單尾部。如果f是TreeBin類型節點,則按照紅黑樹的方法更新或者增加節點
  • 若連結清單長度 > TREEIFY_THRESHOLD(預設是8),則将連結清單轉換為紅黑樹結構
  • 調用addCount方法,ConcurrentHashMap的size + 1

這裡整個put操作已經完成。

ConcurrentHashMap的get操作還是挺簡單的,無非就是通過hash來找key相同的節點而已,當然需要區分連結清單和樹形兩種情況。

public V get(Object key) {
        // ... 超過微信文章長度
    }
           

get操作的整個邏輯非常清楚:

  • 計算hash值
  • 判斷table是否為空,如果為空,直接傳回null
  • 根據hash值擷取table中的Node節點(tabAt(tab, (n - 1) & h)),然後根據連結清單或者樹形方式找到相對應的節點,傳回其value值。

size 操作

ConcurrentHashMap的size()方法我們雖然用得不是很多,但是我們還是很有必要去了解的。ConcurrentHashMap的size()方法傳回的是一個不精确的值,因為在進行統計的時候有其他線程正在進行插入和删除操作。當然為了這個不精确的值,ConcurrentHashMap也是操碎了心。

為了更好地統計size,ConcurrentHashMap提供了baseCount、counterCells兩個輔助變量和一個CounterCell輔助内部類。

@sun.misc.Contended static final class CounterCell {
        volatile long value;
        CounterCell(long x) { value = x; }
    }

    //ConcurrentHashMap中元素個數,但傳回的不一定是目前Map的真實元素個數。基于CAS無鎖更新
    private transient volatile long baseCount;

    private transient volatile CounterCell[] counterCells;
           

這裡我們需要清楚CounterCell 的定義

size()方法定義如下:

public int size() {
        long n = sumCount();
        return ((n < 0L) ? 0 :
                (n > (long)Integer.MAX_VALUE) ? Integer.MAX_VALUE :
                (int)n);
    }
           

内部調用sunmCount():

final long sumCount() {
        CounterCell[] as = counterCells; CounterCell a;
        long sum = baseCount;
        if (as != null) {
            for (int i = 0; i < as.length; ++i) {
                //周遊,所有counter求和
                if ((a = as[i]) != null)
                    sum += a.value;
            }
        }
        return sum;
    }
           

sumCount()就是疊代counterCells來統計sum的過程。我們知道put操作時,肯定會影響size(),我們就來看看CouncurrentHashMap是如何為了這個不和諧的size()操碎了心。

在put()方法最後會調用addCount()方法,該方法主要做兩件事,一件更新baseCount的值,第二件檢測是否進行擴容,我們隻看更新baseCount部分:

private final void addCount(long x, int check) {
        // ... 超過微信文章長度
    }
           

x == 1,如果counterCells == null,則U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x),如果并發競争比較大可能會導緻改過程失敗,如果失敗則最終會調用fullAddCount()方法。其實為了提高高并發的時候baseCount可見性的失敗問題,又避免一直重試,JDK 8 引入了類Striped64,其中LongAdder和DoubleAdder都是基于該類實作的,而CounterCell也是基于Striped64實作的。如果counterCells != null,且uncontended = U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x)也失敗了,同樣會調用fullAddCount()方法,最後調用sumCount()計算s。

其實在1.8中,它不推薦size()方法,而是推崇mappingCount()方法,該方法的定義和size()方法基本一緻:

public long mappingCount() {
        long n = sumCount();
        return (n < 0L) ? 0L : n; // ignore transient negative values
    }
           

當ConcurrentHashMap中table元素個數達到了容量門檻值(sizeCtl)時,則需要進行擴容操作。在put操作時最後一個會調用addCount(long x, int check),該方法主要做兩個工作:1.更新baseCount;2.檢測是否需要擴容操作。如下:

private final void addCount(long x, int check) {
        // ... 超過微信文章長度
    }
           

transfer()方法為ConcurrentHashMap擴容操作的核心方法。由于ConcurrentHashMap支援多線程擴容,而且也沒有進行加鎖,是以實作會變得有點兒複雜。整個擴容操作分為兩步:

  1. 建構一個nextTable,其大小為原來大小的兩倍,這個步驟是在單線程環境下完成的
  2. 将原來table裡面的内容複制到nextTable中,這個步驟是允許多線程操作的,是以性能得到提升,減少了擴容的時間消耗

我們先來看看源代碼,然後再一步一步分析:

private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
        // ... 超過微信文章長度
    }
           

上面的源碼有點兒長,稍微複雜了一些,在這裡我們抛棄它多線程環境,我們從單線程角度來看:

  1. 為每個核心分任務,并保證其不小于16
  2. 檢查nextTable是否為null,如果是,則初始化nextTable,使其容量為table的兩倍
  3. 死循環周遊節點,知道finished:節點從table複制到nextTable中,支援并發,請思路如下:
  • 如果節點 f 為null,則插入ForwardingNode(采用Unsafe.compareAndSwapObjectf方法實作),這個是觸發并發擴容的關鍵
  • 如果f為連結清單的頭節點(fh >= 0),則先構造一個反序連結清單,然後把他們分别放在nextTable的i和i + n位置,并将ForwardingNode 插入原節點位置,代表已經處理過了
  • 如果f為TreeBin節點,同樣也是構造一個反序 ,同時需要判斷是否需要進行unTreeify()操作,并把處理的結果分别插入到nextTable的i 和i+nw位置,并插入ForwardingNode 節點
  1. 所有節點複制完成後,則将table指向nextTable,同時更新sizeCtl = nextTable的0.75倍,完成擴容過程

在多線程環境下,ConcurrentHashMap用兩點來保證正确性:ForwardingNode和synchronized。當一個線程周遊到的節點如果是ForwardingNode,則繼續往後周遊,如果不是,則将該節點加鎖,防止其他線程進入,完成後設定ForwardingNode節點,以便要其他線程可以看到該節點已經處理過了,如此交叉進行,高效而又安全。

[<img src="http://cmsblogs.qiniudn.com/wp-content/uploads/2017/06/201703050001_24_thumb.jpg" alt="201703050001_24]" />

在put操作時如果發現fh.hash = -1,則表示正在進行擴容操作,則目前線程會協助進行擴容操作。

else if ((fh = f.hash) == MOVED)
                tab = helpTransfer(tab, f);
           

helpTransfer()方法為協助擴容方法,當調用該方法的時候,nextTable一定已經建立了,是以該方法主要則是進行複制工作。如下:

final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
        // ... 超過微信文章長度
    }
           

在put操作是,如果發現連結清單結構中的元素超過了TREEIFY_THRESHOLD(預設為8),則會把連結清單轉換為紅黑樹,已便于提高查詢效率。如下:

if (binCount >= TREEIFY_THRESHOLD)
    treeifyBin(tab, i);
           

調用treeifyBin方法用與将連結清單轉換為紅黑樹。

private final void treeifyBin(Node<K,V>[] tab, int index) {
        // ... 超過微信文章長度
    }
           

從上面源碼可以看出,建構紅黑樹的過程是同步的,進入同步後過程如下:

  1. 根據table中index位置Node連結清單,重新生成一個hd為頭結點的TreeNode

繼續閱讀