天天看點

為什麼阿裡巴巴禁止在 foreach 循環裡進行元素的 remove/add 操作

GitHub 1.7k Star 的 Java工程師成神之路 ,不來了解一下嗎? ,真的不來了解一下嗎?

,真的确定不來了解一下嗎?

在阿裡巴巴Java開發手冊中,有這樣一條規定:

為什麼阿裡巴巴禁止在 foreach 循環裡進行元素的 remove/add 操作

但是手冊中并沒有給出具體原因,本文就來深入分析一下該規定背後的思考。

foreach循環

Foreach循環(Foreach loop)是計算機程式設計語言中的一種控制流程語句,通常用來循環周遊數組或集合中的元素。

Java語言從JDK 1.5.0開始引入foreach循環。在周遊數組、集合方面,foreach為開發人員提供了極大的友善。

foreach 文法格式如下:

for(元素類型t 元素變量x : 周遊對象obj){ 
     引用了x的java語句; 
} 

           

以下執行個體示範了 普通for循環 和 foreach循環使用:

public static void main(String[] args) {
    // 使用ImmutableList初始化一個List
    List<String> userNames = ImmutableList.of("Hollis", "hollis", "HollisChuang", "H");

    System.out.println("使用for循環周遊List");
    for (int i = 0; i < userNames.size(); i++) {
        System.out.println(userNames.get(i));
    }

    System.out.println("使用foreach周遊List");
    for (String userName : userNames) {
        System.out.println(userName);
    }
}

           

以上代碼運作輸出結果為:

使用for循環周遊List
Hollis
hollis
HollisChuang
H
使用foreach周遊List
Hollis
hollis
HollisChuang
H

           

可以看到,使用foreach文法周遊集合或者數組的時候,可以起到和普通for循環同樣的效果,并且代碼更加簡潔。是以,foreach循環也通常也被稱為增強for循環。

但是,作為一個合格的程式員,我們不僅要知道什麼是增強for循環,還需要知道增強for循環的原理是什麼?

其實,增強for循環也是Java給我們提供的一個文法糖,如果将以上代碼編譯後的class檔案進行反編譯(使用jad工具)的話,可以得到以下代碼:

Iterator iterator = userNames.iterator();
do
{
    if(!iterator.hasNext())
        break;
    String userName = (String)iterator.next();
    if(userName.equals("Hollis"))
        userNames.remove(userName);
} while(true);
System.out.println(userNames);

           

可以發現,原本的增強for循環,其實是依賴了while循環和Iterator實作的。(請記住這種實作方式,後面會用到!)

問題重制

規範中指出不讓我們在foreach循環中對集合元素做add/remove操作,那麼,我們嘗試着做一下看看會發生什麼問題。

// 使用雙括弧文法(double-brace syntax)建立并初始化一個List
List<String> userNames = new ArrayList<String>() {{
    add("Hollis");
    add("hollis");
    add("HollisChuang");
    add("H");
}};

for (int i = 0; i < userNames.size(); i++) {
    if (userNames.get(i).equals("Hollis")) {
        userNames.remove(i);
    }
}

System.out.println(userNames);

           

以上代碼,首先使用雙括弧文法(double-brace syntax)建立并初始化一個List,其中包含四個字元串,分别是Hollis、hollis、HollisChuang和H。

然後使用普通for循環對List進行周遊,删除List中元素内容等于Hollis的元素。然後輸出List,輸出結果如下:

[hollis, HollisChuang, H]

           

以上是哪使用普通的for循環在周遊的同時進行删除,那麼,我們再看下,如果使用增強for循環的話會發生什麼:

List<String> userNames = new ArrayList<String>() {{
    add("Hollis");
    add("hollis");
    add("HollisChuang");
    add("H");
}};

for (String userName : userNames) {
    if (userName.equals("Hollis")) {
        userNames.remove(userName);
    }
}

System.out.println(userNames);

           

以上代碼,使用增強for循環周遊元素,并嘗試删除其中的Hollis字元串元素。運作以上代碼,會抛出以下異常:

java.util.ConcurrentModificationException

           

同樣的,讀者可以嘗試下在增強for循環中使用add方法添加元素,結果也會同樣抛出該異常。

之是以會出現這個異常,是因為觸發了一個Java集合的錯誤檢測機制——fail-fast 。

fail-fast

接下來,我們就來分析下在增強for循環中add/remove元素的時候會抛出java.util.ConcurrentModificationException的原因,即解釋下到底什麼是fail-fast進制,fail-fast的原理等。

fail-fast,即快速失敗,它是Java集合的一種錯誤檢測機制。當多個線程對集合(非fail-safe的集合類)進行結構上的改變的操作時,有可能會産生fail-fast機制,這個時候就會抛出ConcurrentModificationException(當方法檢測到對象的并發修改,但不允許這種修改時就抛出該異常)。

同時需要注意的是,即使不是多線程環境,如果單線程違反了規則,同樣也有可能會抛出改異常。

那麼,在增強for循環進行元素删除,是如何違反了規則的呢?

要分析這個問題,我們先将增強for循環這個文法糖進行解糖,得到以下代碼:

public static void main(String[] args) {
    // 使用ImmutableList初始化一個List
    List<String> userNames = new ArrayList<String>() {{
        add("Hollis");
        add("hollis");
        add("HollisChuang");
        add("H");
    }};

    Iterator iterator = userNames.iterator();
    do
    {
        if(!iterator.hasNext())
            break;
        String userName = (String)iterator.next();
        if(userName.equals("Hollis"))
            userNames.remove(userName);
    } while(true);
    System.out.println(userNames);
}

           

然後運作以上代碼,同樣會抛出異常。我們來看一下ConcurrentModificationException的完整堆棧:

為什麼阿裡巴巴禁止在 foreach 循環裡進行元素的 remove/add 操作

通過異常堆棧我們可以到,異常發生的調用鍊ForEachDemo的第23行,

Iterator.next

調用了

Iterator.checkForComodification

方法 ,而異常就是checkForComodification方法中抛出的。

其實,經過debug後,我們可以發現,如果remove代碼沒有被執行過,iterator.next這一行是一直沒報錯的。抛異常的時機也正是remove執行之後的的那一次next方法的調用。

我們直接看下checkForComodification方法的代碼,看下抛出異常的原因:

final void checkForComodification() {
    if (modCount != expectedModCount)
        throw new ConcurrentModificationException();
}

           

代碼比較簡單,

modCount != expectedModCount

的時候,就會抛出

ConcurrentModificationException

那麼,就來看一下,remove/add 操作室如何導緻modCount和expectedModCount不相等的吧。

remove/add 做了什麼

首先,我們要搞清楚的是,到底modCount和expectedModCount這兩個變量都是個什麼東西。

通過翻源碼,我們可以發現:

  • modCount是ArrayList中的一個成員變量。它表示該集合實際被修改的次數。
  • expectedModCount 是 ArrayList中的一個内部類——Itr中的成員變量。expectedModCount表示這個疊代器期望該集合被修改的次數。其值是在ArrayList.iterator方法被調用的時候初始化的。隻有通過疊代器對集合進行操作,該值才會改變。
  • Itr是一個Iterator的實作,使用ArrayList.iterator方法可以擷取到的疊代器就是Itr類的執行個體。

他們之間的關系如下:

class ArrayList{
    private int modCount;
    public void add();
    public void remove();
    private class Itr implements Iterator<E> {
        int expectedModCount = modCount;
    }
    public Iterator<E> iterator() {
        return new Itr();
    }
}

           

其實,看到這裡,大概很多人都能猜到為什麼remove/add 操作之後,會導緻expectedModCount和modCount不想等了。

通過翻閱代碼,我們也可以發現,remove方法核心邏輯如下:

為什麼阿裡巴巴禁止在 foreach 循環裡進行元素的 remove/add 操作

可以看到,它隻修改了modCount,并沒有對expectedModCount做任何操作。

簡單總結一下,之是以會抛出ConcurrentModificationException異常,是因為我們的代碼中使用了增強for循環,而在增強for循環中,集合周遊是通過iterator進行的,但是元素的add/remove卻是直接使用的集合類自己的方法。這就導緻iterator在周遊的時候,會發現有一個元素在自己不知不覺的情況下就被删除/添加了,就會抛出一個異常,用來提示使用者,可能發生了并發修改!

正确姿勢

至此,我們介紹清楚了不能在foreach循環體中直接對集合進行add/remove操作的原因。

但是,很多時候,我們是有需求需要過濾集合的,比如删除其中一部分元素,那麼應該如何做呢?有幾種方法可供參考:

1、直接使用普通for循環進行操作

我們說不能在foreach中進行,但是使用普通的for循環還是可以的,因為普通for循環并沒有用到Iterator的周遊,是以壓根就沒有進行fail-fast的檢驗。

List<String> userNames = new ArrayList<String>() {{
        add("Hollis");
        add("hollis");
        add("HollisChuang");
        add("H");
    }};

    for (int i = 0; i < 1; i++) {
        if (userNames.get(i).equals("Hollis")) {
            userNames.remove(i);
        }
    }
    System.out.println(userNames);
           

這種方案其實存在一個問題,那就是remove操作會改變List中元素的下标,可能存在漏删的情況。

2、直接使用Iterator進行操作

除了直接使用普通for循環以外,我們還可以直接使用Iterator提供的remove方法。

List<String> userNames = new ArrayList<String>() {{
        add("Hollis");
        add("hollis");
        add("HollisChuang");
        add("H");
    }};

    Iterator iterator = userNames.iterator();

    while (iterator.hasNext()) {
        if (iterator.next().equals("Hollis")) {
            iterator.remove();
        }
    }
    System.out.println(userNames);

           

如果直接使用Iterator提供的remove方法,那麼就可以修改到expectedModCount的值。那麼就不會再抛出異常了。其實作代碼如下:

為什麼阿裡巴巴禁止在 foreach 循環裡進行元素的 remove/add 操作

3、使用Java 8中提供的filter過濾

Java 8中可以把集合轉換成流,對于流有一種filter操作, 可以對原始 Stream 進行某項測試,通過測試的元素被留下來生成一個新 Stream。

List<String> userNames = new ArrayList<String>() {{
        add("Hollis");
        add("hollis");
        add("HollisChuang");
        add("H");
    }};

    userNames = userNames.stream().filter(userName -> !userName.equals("Hollis")).collect(Collectors.toList());
    System.out.println(userNames);

           

4、使用增強for循環其實也可以

如果,我們非常确定在一個集合中,某個即将删除的元素隻包含一個的話, 比如對Set進行操作,那麼其實也是可以使用增強for循環的,隻要在删除之後,立刻結束循環體,不要再繼續進行周遊就可以了,也就是說不讓代碼執行到下一次的next方法。

List<String> userNames = new ArrayList<String>() {{
        add("Hollis");
        add("hollis");
        add("HollisChuang");
        add("H");
    }};

    for (String userName : userNames) {
        if (userName.equals("Hollis")) {
            userNames.remove(userName);
            break;
        }
    }
    System.out.println(userNames);

           

5、直接使用fail-safe的集合類

在Java中,除了一些普通的集合類以外,還有一些采用了fail-safe機制的集合類。這樣的集合容器在周遊時不是直接在集合内容上通路的,而是先複制原有集合内容,在拷貝的集合上進行周遊。

由于疊代時是對原集合的拷貝進行周遊,是以在周遊過程中對原集合所作的修改并不能被疊代器檢測到,是以不會觸發ConcurrentModificationException。

ConcurrentLinkedDeque<String> userNames = new ConcurrentLinkedDeque<String>() {{
    add("Hollis");
    add("hollis");
    add("HollisChuang");
    add("H");
}};

for (String userName : userNames) {
    if (userName.equals("Hollis")) {
        userNames.remove();
    }
}

           

基于拷貝内容的優點是避免了ConcurrentModificationException,但同樣地,疊代器并不能通路到修改後的内容,即:疊代器周遊的是開始周遊那一刻拿到的集合拷貝,在周遊期間原集合發生的修改疊代器是不知道的。

java.util.concurrent包下的容器都是安全失敗,可以在多線程下并發使用,并發修改。

總結

我們使用的增強for循環,其實是Java提供的文法糖,其實作原理是借助Iterator進行元素的周遊。

但是如果在周遊過程中,不通過Iterator,而是通過集合類自身的方法對集合進行添加/删除操作。那麼在Iterator進行下一次的周遊時,經檢測發現有一次集合的修改操作并未通過自身進行,那麼可能是發生了并發被其他線程執行的,這時候就會抛出異常,來提示使用者可能發生了并發修改,這就是所謂的fail-fast機制。

當然還是有很多種方法可以解決這類問題的。比如使用普通for循環、使用Iterator進行元素删除、使用Stream的filter、使用fail-safe的類等。

本文首發自微信公衆号:Hollis