天天看點

線程池中多餘的線程是如何回收的?

最近閱讀了JDK線程池ThreadPoolExecutor的源碼,對線程池執行任務的流程有了大體了解,實際上這個流程也十分通俗易懂,就不再贅述了,别人寫的比我好多了。

不過,我倒是對線程池是如何回收工作線程比較感興趣,是以簡單分析了一下,加深對線程池的了解吧。

下面以JDK1.8為例進行分析

1. runWorker(Worker w)

工作線程啟動後,就進入runWorker(Worker w)方法。

裡面是一個while循環,循環判斷任務是否為空,若不為空,執行任務;若取不到任務,或發生異常,退出循環,執行processWorkerExit(w, completedAbruptly); 在這個方法裡把工作線程移除掉。

取任務的來源有兩個,一個是firstTask,這個是工作線程第一次跑的時候執行的任務,最多隻能執行一次,後面得從getTask()方法裡取任務。看來,getTask()是關鍵,在不考慮異常的場景下,傳回null,就表示退出循環,結束線程。下一步,就得看看,什麼情況下getTask()會傳回null。

(篇幅有限,分段截取,省略中間執行任務的步驟)

線程池中多餘的線程是如何回收的?
線程池中多餘的線程是如何回收的?

2. getTask() 傳回null

一共有兩種情況會傳回null,見紅框處 。

第一種情況,線程池的狀态已經是STOP,TIDYING, TERMINATED,或者是SHUTDOWN且工作隊列為空;

第二種情況,工作線程數已經大于最大線程數或目前工作線程已逾時,且,還有其他工作線程或任務隊列為空。這點比較難了解,總之先記住,後面會用。

下面以條件1和條件2分别指代這兩種情況的判斷條件。

線程池中多餘的線程是如何回收的?

3. 分場景分析線程池回收工作線程

3.1 未調用shutdown() ,RUNNING狀态下全部任務執行完成的場景

這種場景,會将工作線程的數量減少到核心線程數大小(如果本來就沒有超過,則不需要回收)。

比如一個線程池,核心線程數為4,最大線程數為8。一開始是4個工作線程,當任務把任務隊列塞滿,就得将工作線程增加到8. 當後面任務執行到差不多了,線程取不到任務了,就會回收到4個工作線程的狀态(取決于allowCoreThreadTimeOut的值,這裡讨論預設值false的情況,即核心線程不會逾時。如果為true,工作線程可以全部銷毀)。

可以先排除上面提到的條件1,線程池的狀态已經是STOP,TIDYING, TERMINATED,或者是SHUTDOWN且工作隊列為空。因為線程池一直是RUNNING,這條判斷永遠是false。在這個場景中,可以當條件1不存在。

下面分析取不出任務時線程是怎麼運作的。

step1. 從任務隊列取任務有兩種方式,逾時等待還是可以一直阻塞下去。決定因素是timed變量。該變量在前面指派,如果目前線程數大于核心線程數,變量timed為true, 否則為false(上面說了,這裡隻讨論allowCoreThreadTimeOut為false的情況)。很明顯,現在讨論的是timed為true的情況。keepAliveTime一般不設定,預設值為0,是以基本上可以認為是不阻塞,馬上傳回取任務的結果。

線上程逾時等待喚醒之後,發現取不出任務,timeOut變為true,進入下一次循環。

step2. 來到條件1的判斷,線程池一直RUNNING, 不進入代碼塊。

step3. 來到條件2的判斷,這時任務隊列為空,條件成立,CAS減少線程數,若成功,傳回null,否則,重複step1。

這裡要注意,有可能多條線程同時通過條件2的判斷,那會不會減少後線程的數量反而比預想的核心線程數少呢?

比如目前線程數已經隻有5條了,此時有兩條線程同時喚醒,通過條件2的判斷,同時減少數量,那剩下的線程數反而隻有3條,和預期不一緻。

實際上是不會的。為了防止這種情況,compareAndDecrementWorkerCount(c) 用的是CAS方法,如果CAS失敗就continue,進入下一輪循環,重新判斷。

像上述例子,其中一條線程會CAS失敗,然後重新進入循環,發現工作線程數已經隻有4了,timed為false, 這條線程就不會被銷毀,可以一直阻塞了(workQueue.take())。

這一點我思考了很久才得出答案,一直在想沒有加鎖的情況下是怎麼保證一定能不多不少回收到核心線程數的呢。原來是CAS的奧妙。

從這裡也可以看出,雖然有核心線程數,但線程并沒有區分是核心還是非核心,并不是先建立的就是核心,超過核心線程數後建立的就是非核心,最終保留哪些線程,完全随機。

3.2 調用shutdown() ,全部任務執行完成的場景

這種場景,無論是核心線程還是非核心線程,所有工作線程都會被銷毀。

在調用shutdown()之後,會向所有的空閑工作線程發送中斷信号。

線程池中多餘的線程是如何回收的?

最終傳入false,調用下面這個方法。

線程池中多餘的線程是如何回收的?

可以看出,在發出中斷信号前,會判斷是否已經中斷,以及要獲得工作線程的獨占鎖。

發出中斷信号的時候,工作線程要麼在getTask()裡準備擷取任務,要麼在執行任務,那就得等它執行完目前任務才會發出,因為工作線程在執行任務的時候,也會工作線程加鎖。工作線程執行完任務,又跑到getTask()裡面去了。

是以我們隻要看getTask()裡面怎麼應對中斷異常的就可以了。

線程池中多餘的線程是如何回收的?

工作線程在getTask()裡,有兩種可能。

3.2.1 任務已全部完成,線程在阻塞等待。

很簡單,中斷信号将其喚醒,進而進入下一輪循環。到達條件1處,符合條件,減少工作線程數量,并傳回null,由外層結束這條線程。

這裡的decrementWorkerCount()是自旋式的,一定會減1。

線程池中多餘的線程是如何回收的?
線程池中多餘的線程是如何回收的?

3.2.2 任務還沒有完全執行完

調用shutdown()之後,未執行完的任務要執行完畢,池子才能結束。是以此時有可能線程還在工作。

這裡又要分兩個階段讨論

階段1 任務較多,工作線程都能獲得任務

這裡還不涉及到線程退出,可以跳過不看,隻是分析一下收到中斷信号後線程的表現。

假設有線程A,正通過getTask()裡擷取任務。此時A被中斷,在擷取任務時,無論是poll()還是take(),都會抛出中斷異常。異常被捕獲,重新進入下一輪循環,隻要隊列不為空,就可以繼續取任務。

線程A被中斷,再次取任務,調用workQueue.poll() or workQueue.take(),不會抛出異常嗎?還可以正常取出任務嗎?

這就要看workQueue的實作了。workQueue是BlockingQueue類型,以常見的LinkedBlockingQueue和ArrayBlockingQueue為例,加鎖時都是調用lockInterruptibly(),是響應中斷的。該方法又調用了AQS的acquireInterruptibly(int arg)。

acquireInterruptibly(int arg),無論是在入口處判斷中斷異常,還是在parkAndCheckInterrupt()方法阻塞,被中斷喚醒并判斷中斷異常時,均使用了Thread.interrupted()。這個方法會傳回線程的中斷狀态,并把中斷狀态重置!也就是說,線程不再是中斷狀态了,這樣在再次取任務時,就不會報錯了。

是以,這對于正在準備取任務的線程,隻是相當于浪費了一次循環,這可能是線程中斷帶來的副作用吧,當然,對整體的運作不影響。

分析到這裡,我不禁感歎,這裡BlockingQueue剛好是會重置中斷狀态,這到底是怎麼想出來的絕妙設計啊?Doug Lea大神Orz.

線程池中多餘的線程是如何回收的?

階段2 任務剛好要執行完了

這時任務已經快取完了,比如有4條工作線程,隻剩下2個任務,那就可能出現2條線程獲得任務,2條線程阻塞。

因為在擷取任務前的判斷,沒有加鎖,那麼會不會出現,所有線程都通過了前面的校驗,來到workQueue擷取任務的地方,剛好任務隊列已經空了,線程全部阻塞了呢?因為shutdown() 已經執行完畢,無法再向線程發出中斷信号,進而線程一直在阻塞,無法被回收。

這種是不會發生的。

假設有A,B,C,D四條工作線程,同時通過了條件1和條件2的判斷,來到取任務的地方。那麼,工作隊列至少還有一個任務,至少會有一條線程能取到任務。

假設A,B獲得了任務,C,D阻塞。

A, B接下來的步驟是:

step1.任務執行完成後,再次getTask(),此時符合條件1,傳回null,線程準備被回收。

step2.processWorkerExit(Worker w, boolean completedAbruptly) 将線程回收。

回收就隻是把線程幹掉這麼簡單嗎?來看看processWorkerExit(Worker w, boolean completedAbruptly) 的方法。

線程池中多餘的線程是如何回收的?

可以看到,在裡面除了workers.remove(w) 移除線,還調用了tryTerminate()。

線程池中多餘的線程是如何回收的?

第一個判斷條件沒有一個子條件符合,跳過。第二個條件,工作線程還存在,那麼随機中斷一條空閑線程。

那麼問題就來了,中斷一條空閑線程,也沒說是一定中斷正在阻塞的線程啊。如果A, B同時退出,有沒有可能出現A中斷B, B中斷A,AB互相中斷,進而沒有線程去中斷喚醒阻塞的線程呢?

答案仍然是,想多了……

假設A能走到這裡,說明A已經從工作線程的集合workers裡面移除了(processWorkerExit(Worker w, boolean completedAbruptly) 在tryTerminate()之前,已經将其移除)。那麼A中斷B,B來到這裡中斷,就不會在workers裡面找到A了。

線程池中多餘的線程是如何回收的?

也就是說,退出的線程不能互相中斷,我從集合中退出後,中斷了你,你不能中斷我,因為我已經退出集合,你隻能中斷别人。那麼,即使有N個線程同時退出,至少在最後,也會有一條線程,會中斷剩餘的阻塞線程。

就像多米諾骨牌一樣,中斷信号就會被傳播下去。

阻塞的C,D中的任意一條被中斷喚醒後,又會重複step1的動作,周而複始,直到所有阻塞線程都被中斷,喚醒。

這也是為什麼在tryTerminate()裡面,傳入false,隻需要中斷任意一條空閑線程的原因。

想到這裡,再次對Doug Lea心生欽敬(粵語)之情。這設計得也太妙了叭。

4. 總結

ThreadPoolExecutor回收工作線程,一條線程getTask()傳回null,就會被回收。

分兩種場景。

  1. 未調用shutdown() ,RUNNING狀态下全部任務執行完成的場景

線程數量大于corePoolSize,線程逾時阻塞,逾時喚醒後CAS減少工作線程數,如果CAS成功,傳回null,線程回收。否則進入下一次循環。當工作者線程數量小于等于corePoolSize,就可以一直阻塞了。

  1. 調用shutdown() ,全部任務執行完成的場景

shutdown() 會向所有線程發出中斷信号,這時有兩種可能。

2.1)所有線程都在阻塞

中斷喚醒,進入循環,都符合第一個if判斷條件,都傳回null,所有線程回收。

2.2)任務還沒有完全執行完

繼續閱讀