搞懂ConcurrentHashMap，这一篇就够了

上期我们提到了HashMap是线程不安全的，因此在并发环境下HashMap会带来问题。代码如下：

public static void main(String[] args) {
    HashMap<Integer, Integer> map = new HashMap<>();
    //线程一
    new Thread(() -> {
        for (int i = 0; i < 30; i++) {
            map.put(i, i);
            System.out.println(map.toString());
        }
    }).start();
    //线程二
    new Thread(() -> {
        for (int i = 0; i < 30; i++) {
            map.put(i, i);
            System.out.println(map.toString());
        }
    }).start();
    //线程三
    new Thread(() -> {
        for (int i = 0; i < 30; i++) {
            map.put(i, i);
            System.out.println(map.toString());
        }
    }).start();
}

我们创建三个线程来同时向HashMap中添加元素，就会产生问题，抛出java.util.ConcurrentModificationException的异常。

Exception in thread "Thread-1" Exception in thread "Thread-2" java.util.ConcurrentModificationException
  at java.util.HashMap$HashIterator.nextNode(HashMap.java:1445)
  at java.util.HashMap$EntryIterator.next(HashMap.java:1479)
  at java.util.HashMap$EntryIterator.next(HashMap.java:1477)
  at java.util.AbstractMap.toString(AbstractMap.java:554)
  at com.study.map.HashMapDemo.lambda$main$1(HashMapDemo.java:24)
  at java.lang.Thread.run(Thread.java:748)

那如何来解决这个问题呢？

①我们很容易想到，使用HashTable，因为HashTable是线程安全的，但HashTable在每个方法上都加了synchronized关键字，效率很低。

②使用Collections.synchronizedMap()方法，将HashMap转化为SynchronizedMap，其实还是添加了synchronized关键字，没什么本质区别。

③使用ConcurrentHashMap，它是JUC包下的一个类，用于处理HashMap多线程下引发的线程安全问题，并且性能很高。

下面我们就来深入学习ConcurrentHashMap，研究一下他为什么高效。

一、ConcurrentHashMap简介

在JDK1.7中，ConcurrentHashMap采用了Segment+HashEntry的数据结构来存储，大致结构是下边这个样子：

搞懂ConcurrentHashMap，这一篇就够了

每一个ConcurrentHashMap都有一个segment数组，每个segment又包含了一个table数据，每一个结点的类型是HashEntry。每次put操作时会先寻找Segment，然后再寻找HashEntry，也就是两次寻找桶的过程。Segment部分代码如下：

static final class Segment<K,V> extends ReentrantLock implements Serializable {
    private static final long serialVersionUID = 2249069246763182397L;
    
    /**
     * put时候会尝试获取锁，如果获取失败肯定就有其他线程存在竞争，
     * 则利用scanAndLockForPut()自旋获取锁,如果重试的次数达到了
     * MAX_SCAN_RETRIES 则改为阻塞锁获取，保证能获取成功。
     */
    static final int MAX_SCAN_RETRIES =
        Runtime.getRuntime().availableProcessors() > 1 ? 64 : 1;
    //每一个segment都含有一个table,通过entryAt/setEntryAt访问
    transient volatile HashEntry<K,V>[] table;
    //元素个数
    transient int count;
    //修改的次数
    transient int modCount;
    //阈值，超过时会rehash
    transient int threshold;
    //负载因子    
    final float loadFactor;
}

由于Segment继承了ReentrantLock，所以在put操作时，会将当前Segment进行上锁，默认为16个segment。

HashEntry代码如下：

static final class HashEntry<K,V> {
    final int hash;
    final K key;
    volatile V value;
    volatile HashEntry<K,V> next;

    HashEntry(int hash, K key, V value, HashEntry<K,V> next) {
        this.hash = hash;
        this.key = key;
        this.value = value;
        this.next = next;
    }

    /**
     * Sets next field with volatile write semantics.  (See above
     * about use of putOrderedObject.)
     */
    final void setNext(HashEntry<K,V> n) {
        UNSAFE.putOrderedObject(this, nextOffset, n);
    }

    // Unsafe mechanics
    static final sun.misc.Unsafe UNSAFE;
    static final long nextOffset;
    static {
        try {
            UNSAFE = sun.misc.Unsafe.getUnsafe();
            Class k = HashEntry.class;
            nextOffset = UNSAFE.objectFieldOffset
                (k.getDeclaredField("next"));
        } catch (Exception e) {
            throw new Error(e);
        }
    }
}

而在JDK1.8之后，著名的Doug Lea大师可能觉得两次寻找桶的过程和锁住segment太慢了，于是做出了更加细粒度的上锁控制，采用了锁桶的方式（后续详细代码会有看到），并且摒弃了Segment（ReentrantLock）的方式，采用了Synchronized+CAS来控制并发。数据结构上采用了的数组+链表+红黑树，与HashMap相同。

二、ConcurrentHashMap的部分源码说明

由于现在主流的还是JDK1.8，所以还是基于JDK1.8来进行。源码如下：

public class ConcurrentHashMap<K,V> extends AbstractMap<K,V>
    implements ConcurrentMap<K,V>, Serializable {
    private static final long serialVersionUID = 7249069246763182397L;
    /**
     * 最大容量
     */
    private static final int MAXIMUM_CAPACITY = 1 << 30;

    /**
     * 默认容量
     */
    private static final int DEFAULT_CAPACITY = 16;

    /**
     * 数组可能最大额容量，在toArray或者相关方法中使用
     */
    static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

    /**
     * 默认的并发级别，没有使用，是为了和之前的版本兼容
     */
    private static final int DEFAULT_CONCURRENCY_LEVEL = 16;

    /**
     * 负载因子
     */
    private static final float LOAD_FACTOR = 0.75f;

    /**
     * 树化阈值
     */
    static final int TREEIFY_THRESHOLD = 8;

    /**
     * 链化阈值
     */
    static final int UNTREEIFY_THRESHOLD = 6;

    /**
     * 最小树化桶个数
     */
    static final int MIN_TREEIFY_CAPACITY = 64;

    /**
     * 每次进行转移的最小值
     */
    private static final int MIN_TRANSFER_STRIDE = 16;

    /**
     * sizeCtl中记录扩容线程的位数，默认16位
     */
    private static int RESIZE_STAMP_BITS = 16;
    
    /**
     * 进行扩容所允许的最大线程数
     */
    private static final int MAX_RESIZERS = (1 << (32 - RESIZE_STAMP_BITS)) - 1;

    /**
     * sizeCtl中记录容量的位数，默认16位
     */
    private static final int RESIZE_STAMP_SHIFT = 32 - RESIZE_STAMP_BITS;

    /*
     * 一些HashCode值的含义
     */
    static final int MOVED     = -1; // hash for forwarding nodes
    static final int TREEBIN   = -2; // hash for roots of trees
    static final int RESERVED  = -3; // hash for transient reservations
    static final int HASH_BITS = 0x7fffffff; // usable bits of normal node hash

    /** CPU个数 */
    static final int NCPU = Runtime.getRuntime().availableProcessors();
    
    /**
     * node数组，用于存储元素
     */
    transient volatile Node<K,V>[] table;

    /**
     * 扩容后的下一个数组
     */
    private transient volatile Node<K,V>[] nextTable;

    /**
     * 基本计数器值
     */
    private transient volatile long baseCount;

    /**
     * 当sizeCrl为-1时，表明table数组正在被初始化。
     * 当sizeCtl为其他负数时，其高16位代表此次扩容操作数组的一个标记
     *（与table数组的大小有关），低16位代表(1+正在参与扩容的线程数)，
     * 当sizeCtl为0时，表明此时table数组为null，使用默认的初始化大小，即16。
     * 当sizeCtl为正数，且table数组为null时，sizeCtl代表table的初始化大小。
     * 当sizeCtl为正数，且table数组不为null时，sizeCtl代表下一次扩容的扩容阈值
     */
    private transient volatile int sizeCtl;

    /**
     * 扩容下另一个表的索引
     */
    private transient volatile int transferIndex;

    /**
     * 自旋锁标记
     * 用于保护初始化CounterCell、初始化CounterCell数组以及
     * 对CounterCell数组进行扩容时的安全
     */
    private transient volatile int cellsBusy;

    /**
     * 初始大小为2，每次扩容翻倍，存储CounterCell对象，
     * 该对象有个value变量，用来存储个数
     * 该数组的大小上限与当前机器的CPU数量有关，它不会被主动初始化，
     * 只有在调用fullAddCount()函数时才会进行初始化.
     */
    private transient volatile CounterCell[] counterCells;

    // 一些视图
    private transient KeySetView<K,V> keySet;
    private transient ValuesView<K,V> values;
    private transient EntrySetView<K,V> entrySet;

}

CounterCell内部类，用于记录元素个数。使用时是一个CounterCell数组，分片记录个数。

补充小知识，不想看可忽略：@sun.misc.Contended 是 Java 8 新增的一个注解，对某字段加上该注解则表示该字段会单独占用一个缓存行（Cache Line），不然会造成伪共享问题，比如当一个 CPU 要修改某共享变量 A 时会先锁定A 所在的缓存行，并且把其他 CPU 缓存上相关的缓存行设置为无效。但如果被锁定或失效的缓存行里，还存储了变量 B，其他线程此时就访问不了 B，或者由于缓存行失效需要重新从内存中读取加载到缓存里，这就造成了开销。所以让共享变量 A 单独使用一个缓存行就不会影响到其他线程的访问。

/**
 * A padded cell for distributing counts.  Adapted from LongAdder
 * and Striped64.  See their internal docs for explanation.
 */
@sun.misc.Contended static final class CounterCell {
    volatile long value;
    CounterCell(long x) { value = x; }
}

三、ConcurrentHashMap的一些重要方法

ConcurrentHashMap中几乎所有的操作都是基于sun.misc.Unsafe中原子操作实现多并发的无锁化操作（CAS）。

①put方法，添加元素

public V put(K key, V value) {
    return putVal(key, value, false);
}

final V putVal(K key, V value, boolean onlyIfAbsent) {
    //这里说明了ConcurrentHashMap不支持null键和null值    
    if (key == null || value == null) 
        throw new NullPointerException();
    //计算hash值    
    int hash = spread(key.hashCode());
    int binCount = 0;
    for (Node<K,V>[] tab = table;;) {
        //f当前桶  n桶个数 i桶下标  fh桶哈希
        Node<K,V> f; int n, i, fh;
        //如果table为空，则对table进行初始化，
        //这也是ConcurrentHashMap的懒加载
        if (tab == null || (n = tab.length) == 0)
            tab = initTable();
        //寻找桶，如果桶未初始化，通过CAS进行赋值
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            if (casTabAt(tab, i, null,
                         new Node<K,V>(hash, key, value, null)))
                break;                   // no lock when adding to empty bin
        }
        //当前桶不为空并且正在进行移动
        else if ((fh = f.hash) == MOVED)
            tab = helpTransfer(tab, f);
        //赋值
        else {
            V oldVal = null;
            //对当前桶上锁
            synchronized (f) {
                if (tabAt(tab, i) == f) {
                    if (fh >= 0) {
                        //记录桶中元素个数 超过8进行树化
                        binCount = 1;
                        //向链表c插入元素的过程
                        for (Node<K,V> e = f;; ++binCount) {
                            K ek;
                            if (e.hash == hash &&
                                ((ek = e.key) == key ||
                                 (ek != null && key.equals(ek)))) {
                                oldVal = e.val;
                                if (!onlyIfAbsent)
                                    e.val = value;
                                break;
                            }
                            Node<K,V> pred = e;
                            if ((e = e.next) == null) {
                                pred.next = new Node<K,V>(hash, key,
                                                          value, null);
                                break;
                            }
                        }
                    }
                    else if (f instanceof TreeBin) {
                        Node<K,V> p;
                        binCount = 2;
                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                       value)) != null) {
                            oldVal = p.val;
                            if (!onlyIfAbsent)
                                p.val = value;
                        }
                    }
                }
            }
            if (binCount != 0) {
                if (binCount >= TREEIFY_THRESHOLD)
                    treeifyBin(tab, i);
                if (oldVal != null)
                    return oldVal;
                break;
            }
        }
    }
    //判断是否需要扩容，总容量加1
    addCount(1L, binCount);
    return null;
}

②initTable方法，对table进行一下初始化，还有一些字段的默认值

private final Node<K,V>[] initTable() {
    Node<K,V>[] tab; int sc;
    while ((tab = table) == null || tab.length == 0) {
        //负数表示初始化或resize，这里只能是初始化
        if ((sc = sizeCtl) < 0)
            Thread.yield(); // lost initialization race; just spin
        else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
            try {
                if ((tab = table) == null || tab.length == 0) {
                    //sizeCtl此时为-1,走默认容量
                    int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                    @SuppressWarnings("unchecked")
                    Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                    table = tab = nt;
                    //设置为n大小的0.75倍，这就是位运算的魅力吗？
                    sc = n - (n >>> 2);
                }
            } finally {
                //将sizeCtl设置为阈值
                sizeCtl = sc;
            }
            break;
        }
    }
    return tab;
}

③addCount方法，添加元素

private final void addCount(long x, int check) {
    //b当前总大小，s添加后大小
    CounterCell[] as; long b, s;
    //CAS给baseCount + 1
    if ((as = counterCells) != null ||
        !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
        CounterCell a; long v; int m;
        boolean uncontended = true;
        //ThreadLocalRandom.getProbe() 得到当前线程的探针哈希值
        if (as == null || (m = as.length - 1) < 0 ||
            //寻找桶
            (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
            !(uncontended =
              U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
            fullAddCount(x, uncontended);
            return;
        }
        if (check <= 1)
            return;
        //对CounterCell中的数目累加
        s = sumCount();
    }
    if (check >= 0) {
        Node<K,V>[] tab, nt; int n, sc;
        //检查是否需要扩容
        while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
               (n = tab.length) < MAXIMUM_CAPACITY) {
            int rs = resizeStamp(n);
            if (sc < 0) {
                if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                    sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                    transferIndex <= 0)
                    break;
                if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                    transfer(tab, nt);
            }
            else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                         (rs << RESIZE_STAMP_SHIFT) + 2))
                transfer(tab, null);
            s = sumCount();
        }
    }
}

④fullAndCount()方法，用来初始化CounterCell，来记录元素个数，里面包含扩容，初始化等操作。当前CounterCell为null、长度-1小于0、CounterCell某个位置为null、给当前CounterCell进行CAS赋值产生冲突都会执行此方法。

private final void fullAddCount(long x, boolean wasUncontended) {
    int h;
    //判断ThreadLocalRandom.getProbe()是否为0，为0则初始化，并
    //设置未冲突标志位为true
    if ((h = ThreadLocalRandom.getProbe()) == 0) {
        ThreadLocalRandom.localInit();      // force initialization
        h = ThreadLocalRandom.getProbe();
        wasUncontended = true;
    }
    boolean collide = false;                // True if last slot nonempty
    //自旋锁
    for (;;) {
        CounterCell[] as; CounterCell a; int n; long v;
        //判断counterCells是否被初始化过了
        if ((as = counterCells) != null && (n = as.length) > 0) {
            //找桶
            if ((a = as[(n - 1) & h]) == null) {
                //cellsBusy=0 没有线程对CounterCells进行操作
                if (cellsBusy == 0) {            // Try to attach new Cell
                    CounterCell r = new CounterCell(x); // Optimistic create
                    //通过cas设置cellsBusy标识，防止其他线程来对CounterCells并发处理
                    if (cellsBusy == 0 &&
                        U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
                        boolean created = false;
                        try {               // Recheck under lock
                            CounterCell[] rs; int m, j;
                            if ((rs = counterCells) != null &&
                                (m = rs.length) > 0 &&
                                rs[j = (m - 1) & h] == null) {
                                //将初始化的r对象的元素赋值到对应的位置
                                rs[j] = r;
                                created = true;
                            }
                        } finally {
                            //恢复标记位
                            cellsBusy = 0;
                        }
                        if (created)
                            break;
                        //continue表示当前CounterCell不是空，自旋再处理
                        continue;           // Slot is now non-empty
                    }
                }
                collide = false;
            }
            //CAS失败
            else if (!wasUncontended)       // CAS already known to fail
                //设置为未冲突标识，进入下一次自旋
                wasUncontended = true;      // Continue after rehash
            //由于指定下标位置的CounterCell值不为空，则直接通过cas进行累加，成功直接退出
            else if (U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))
                break;
            //如果已经有其他线程建立了新的CounterCells或者CounterCells大于CPU核心数
            else if (counterCells != as || n >= NCPU)
                collide = false;            // At max size or stale
            else if (!collide)
                collide = true;
            //进行扩容
            else if (cellsBusy == 0 &&
                     U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
                try {
                    if (counterCells == as) {// Expand table unless stale
                        CounterCell[] rs = new CounterCell[n << 1];
                        for (int i = 0; i < n; ++i)
                            rs[i] = as[i];
                        counterCells = rs;
                    }
                } finally {
                    cellsBusy = 0;
                }
                collide = false;
                continue;                   // Retry with expanded table
            }
            h = ThreadLocalRandom.advanceProbe(h);
        }
        //进行初始化
        else if (cellsBusy == 0 && counterCells == as &&
                 U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
            boolean init = false;
            try {                           // Initialize table
                if (counterCells == as) {
                    //默认两个在这儿
                    CounterCell[] rs = new CounterCell[2];
                    rs[h & 1] = new CounterCell(x);
                    counterCells = rs;
                    init = true;
                }
            } finally {
                cellsBusy = 0;
            }
            if (init)
                break;
        }
        //CounterCells被占用，直接累加在baseCount变量中，防止一直自旋
        else if (U.compareAndSwapLong(this, BASECOUNT, v = baseCount, v + x))
            break;                          // Fall back on using base
    }
}

核心的方法就介绍这么多吧，剩下的大家有兴趣自己阅读即可，阅读源码的目的就是为了理解并学习他们的思路，以后可以运用到我们的代码当中。最后想说一下，阅读源码，大家请务必坚持，坚持就是胜利，Doug Lea yyds。

今天的分享就到此结束啦，喜欢的小伙伴记得点赞呦。

下期预告：ArrayList + CopyOnWriteList。

关注公众号JavaGrowUp，下期不迷路，获取更多精彩内容。

搞懂ConcurrentHashMap，这一篇就够了

搞懂ConcurrentHashMap，这一篇就够了

继续阅读

关于Gradle配置的小结

Java小案例——随机数猜测随机数猜测

nginx location中斜线的位置的重要性

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的简单使用

neo4j之cypher使用文档

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

mybatis_入门程序Mybatis入门

AOP编程_Android优雅权限框架(1)概念基础，2021金三银四前言正文大纲正文

Effective Java 8:通用程序设计

OOM三种类型

工厂模式-三种类型

【递归】高效率求2的n次幂

win10本地scala和spark安装安装scala安装spark

scala (3) Function 和 Method