天天看點

ArrayList為什麼線程不安全 線程不安全展現在哪些方面 源碼角度分析其具體原因一、ArrayList源碼摘錄二、測試用例三、ArrayList線程不安全的表現總結

一、ArrayList源碼摘錄

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
    /**
     * 清單元素集合數組
     * 說明ArrayList基于數組存儲資料
     */
    transient Object[] elementData; 

    /**
     * 清單大小,elementData中存儲的元素個數
     */
    private int size;
}           

add() 方法

/**
 * Appends the specified element to the end of this list.
 * 将指定的元素追加到清單的末尾。
 * add() 方法做了如下操作:
 *     1.檢查容量是否足夠,如不夠将進行擴容,并自增 modCount
 *     2.将指定的元素追加到清單的末尾
 *
 * @param e element to be appended to this list
 * @return <tt>true</tt> (as specified by {@link Collection#add})
 */
public boolean add(E e) {
    //確定容量足夠,如果不夠進行擴容
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    //将e存在index為size的位置(即最後一位的下一位置),size++
    //我們都知道,++操作不是原子指令,多線程情況下将發生并發問題
    elementData[size++] = e;
    return true;
}           

二、測試用例

@Test
public void listThreadUnsafe() throws InterruptedException {
    List<String> list = new ArrayList<>();
    Thread t1 = new Thread(new Runnable() {
        @Override
        public void run() {
            for (int i = 0; i < 100; i++) {
                list.add("t1-" + i);
            }
        }
    });
    Thread t2 = new Thread(new Runnable() {
        @Override
        public void run() {
            for (int i = 0; i < 100; i++) {
                list.add("t2-" + i);
            }
        }
    });
    t1.start();
    t2.start();

    Thread.sleep(2000);
    int size = list.size();
    System.out.println("size = " + size);
    for (int i = 0; i < size; i++) {
        System.out.println("索引為" + i + "的元素為:" + list.get(i));
    }
}           

本用例多跑幾次,将出現下面幾種并發問題。

三、ArrayList線程不安全的表現

add()實際執行的過程為:

elementData[size] = e;
size = size + 1;           

1. 并發環境下進行add操作時可能會導緻elementData數組越界

問題現場如下:
有兩個線程:t1,t2。有ArrayList size=9(即其中有9個元素)。elementData.length=10
t1進入add()方法,這時擷取到size值為9,調用ensureCapacityInternal()方法判斷容量是否需要擴容
t2也進入add()方法,這時擷取到size值也為9,也調用ensureCapacityInternal()方法判斷容量是否需要擴容
t1發現自己的需求為size+1=10,容量足夠,無需擴容
t1發現自己的需求為也size+1=10,容量足夠,無需擴容
t1開始設定元素操作,elementData[size++] = e,成功,此時size變為10
t2也開始進行設定元素操作,它嘗試設定elementData[10] = e,而elementData沒有進行過擴容,它的下标最大為9。于是此時會報出一個數組越界的異常:ArrayIndexOutOfBoundsException
           

用例展現為:

ArrayList為什麼線程不安全 線程不安全展現在哪些方面 源碼角度分析其具體原因一、ArrayList源碼摘錄二、測試用例三、ArrayList線程不安全的表現總結

2. 一個線程的值覆寫另一個線程添加的值

這個問題要分多鐘情況了

2.1 情況1 size大小符合預期,但是中間有null值存在

流程描述如下:

問題現場如下:
有兩個線程:t1,t2。有ArrayList size=5(即其中有5個元素)。elementData.length=10
t1進入add()方法,這時擷取到size值為5,調用ensureCapacityInternal()方法判斷容量是否需要擴容
t2也進入add()方法,這時擷取到size值也為5,也調用ensureCapacityInternal()方法判斷容量是否需要擴容
t1發現自己的需求為size+1=6,容量足夠,無需擴容
t1發現自己的需求為也size+1=6,容量足夠,無需擴容
t1開始設定元素操作,elementData[size] = e,成功,
t2也開始設定元素操作,elementData[size] = e,成功,注意此時t1的size+1還沒執行
t1 size = size + 1 = 6,并寫入主存
t2 size = size + 1 = 7
這樣,size符合預期,但是t2設定的值被覆寫,而且索引為6的位置将永遠為null,因為size已經為7,下次add()也會從7開始。除非手動set值。
           

用例展現如下:

ArrayList為什麼線程不安全 線程不安全展現在哪些方面 源碼角度分析其具體原因一、ArrayList源碼摘錄二、測試用例三、ArrayList線程不安全的表現總結

我們發現,t2的“t2-0”元素被覆寫。

2.2 情況2 size大小比預期的小

情況分析:

問題現場如下:
有兩個線程:t1,t2。有ArrayList size=5(即其中有5個元素)。elementData.length=10
t1進入add()方法,這時擷取到size值為5,調用ensureCapacityInternal()方法判斷容量是否需要擴容
t2也進入add()方法,這時擷取到size值也為5,也調用ensureCapacityInternal()方法判斷容量是否需要擴容
t1發現自己的需求為size+1=6,容量足夠,無需擴容
t1發現自己的需求為也size+1=6,容量足夠,無需擴容
t1開始設定元素操作,elementData[size] = e,成功,
t2也開始設定元素操作,elementData[size] = e,成功,注意此時t1的size+1還沒執行
t1 size = size + 1 = 6,暫未寫入主存
t2 size = size + 1 此時因為t1操作完size還未寫入主存,是以size依然為5,+1後仍為6
t1将size=6 寫入主存
t2将size=6 寫入主存
這樣,size=6 比預期結果小了。
           

用例展現:

ArrayList為什麼線程不安全 線程不安全展現在哪些方面 源碼角度分析其具體原因一、ArrayList源碼摘錄二、測試用例三、ArrayList線程不安全的表現總結

總結

上面介紹的情況都有其出現的機率,并不是每次都出現,隻是在臨界狀态下出現錯誤。但是,作為程式的編寫者,即使有千萬分之一的機率,我們也要盡量去避免它,這是程式員的基本素養。

Tips

關于寫入主存。

基本現在的CPU都是多核心的,每個核心有各自的高速緩存,計算任務需要在高速緩存中進行,對于緩存的通路速度

L1 > L2 > L3 > 記憶體

。L1、L2為各核心獨有,L3為多個核心共享。

我們的程式運作在主記憶體,但計算需要在CPU中完成。

當執行計算任務時,比如

size+1

操作,CPU先将

size

的值讀進CPU緩存,在CPU緩存中計算 +1,然後再将結果寫入主記憶體。

繼續閱讀