天天看點

JAVA多線程與高并發(七)[線程池的基本概念,ThreadPoolExecutor的簡單使用和源碼解讀]

link-JAVA多線程與高并發系列[前言,大綱,目錄]

目錄

    • 前置知識
      • Executor:
      • ExecutorService:
      • Future&Callable
      • FutureTask(比較常用)
      • CompletableFuture(非常靈活)
    • 認識ThreadPoolExecutor
      • ThreadPoolExecutor的七個重要參數:
      • 測試小例子:
      • 調整線程池的大小
    • ThreadPoolExecutor源碼解析
      • 1、常用變量的解釋
      • 2、構造方法
      • 3、送出執行task的過程
      • 4、addworker源碼解析
      • 5、線程池worker任務單元
      • 6、核心線程執行邏輯-runworker

前置知識

關鍵類:

Executor <-extends- ExecutorService <-implements-AbstractExecutorService <-extends- ExecutorService

Callable,Future

Executor:

任務的定義和執行分開,隻有一個執行Runnable方法:

void execute(Runnable command);

ExecutorService:

除了繼承Executor可以執行任務的功能,還完善了整個任務執行器(線程池)的生命周期.比如,一個線程池裡面有很多線程,怎麼送出任務,執行完任務之後應該怎麼處理線程,怎麼關閉等等.

Future&Callable

可以看到ExecutorService裡面有個方法,送出異步的任務:

Future submit(Callable task);

Callable:和Runnable類似,是一個任務,隻不過它執行完後有傳回值,有了傳回值就可以有各種玩法了.

Future:Callable執行完後有一個傳回值,通過Future可以拿到這個結果.

存儲了一個會在将來産生的結果.

看個簡單的例子:

public static void main(String[] args) throws ExecutionException, InterruptedException {
        ExecutorService service = Executors.newCachedThreadPool();
        Future<String> future = service.submit(() -> {
            // spend some seconds doing something
            TimeUnit.SECONDS.sleep(2);
            return "Hello World!";
        }); //異步

        System.out.println("i will get~");
        System.out.println(future.get());//阻塞
        service.shutdown();
    }
           

FutureTask(比較常用)

FutureTask implements RunnableFuture,RunnableFuture extend Runnable, Future

FutureTask内部維護了一個Callable成員變量

前面用的Callable隻是一個任務,Future隻是一個傳回值,這個FutureTask就是結合了一下,既是任務又是傳回值.(Apple+pen->pineapple! 😃)

線程池WorkStealingPool和ForkJoinPool用到了FutureTask

看一個小例子:

public static void main(String[] args) throws InterruptedException, ExecutionException {
        FutureTask<Integer> task = new FutureTask<>(() -> {
            TimeUnit.MILLISECONDS.sleep(500);
            return 1000;
        }); //new Callable () { Integer call();}
        // 可以是線程,也可以是線程池
        new Thread(task).start();
        System.out.println(task.get()); //阻塞
    }
           

CompletableFuture(非常靈活)

CompletableFuture implements Future,CompletionStage

一個典型的應用場景:

有很多個子系統,他們各自有自己的資料庫存儲系統,可能是MySQL/Oracle/MongoDB等,現在需要統計他們的名額(比如平均請求響應時間)在一張大屏上展示分析.如果串行去查詢子系統的資料,那這個分析的API就執行太久了,但是我們使用CompletableFuture,多線程異步執行,那時間就大大縮短.

當然這個場景用普通線程執行Callable也是可以搞定的,隻是用CompletableFuture比較友善,相當于JDK已經造好輪子了,我們可以直接用它.

show my code:

public class TestCompletableFuture {
    public static void main(String[] args) throws ExecutionException, InterruptedException {
        normalTest();
        futureTest();
//        test002();
    }

    private static void normalTest() {
        long start = System.currentTimeMillis();
        Map<String, Double> metrics = new HashMap<>(4);
        metrics.put("metricsOfMySQL", metricsOfMySQL());
        metrics.put("metricsOfOracle", metricsOfOracle());
        metrics.put("metricsOfMongoDB", metricsOfMongoDB());

        long end = System.currentTimeMillis();
        System.out.println("use serial method call! " + (end - start));
        System.out.println(metrics + "\n-------------------------------------");
    }

    private static void futureTest() {
        long start = System.currentTimeMillis();

        Map<String, Double> metrics = new HashMap<>(4);
        CompletableFuture<Double> metricsOfMySQL = CompletableFuture.supplyAsync(TestCompletableFuture::metricsOfMySQL)
                .thenApply(value -> metrics.put("metricsOfMySQL", value));
        CompletableFuture<Double> metricsOfOracle = CompletableFuture.supplyAsync(TestCompletableFuture::metricsOfOracle)
                .thenApply(value -> metrics.put("metricsOfOracle", value));
        CompletableFuture<Double> metricsOfMongoDB = CompletableFuture.supplyAsync(TestCompletableFuture::metricsOfMongoDB)
                .thenApply(value -> metrics.put("metricsOfMongoDB", value));

        System.out.println(metrics);
        CompletableFuture.allOf(metricsOfMySQL, metricsOfOracle, metricsOfMongoDB).join();

        long end = System.currentTimeMillis();
        System.out.println("use completable future! " + (end - start));
        System.out.println(metrics);
    }

    // 其他的用法,靈活的處理結果,有點函數式程式設計的感覺
    private static void test002() {
        // 異步執行
        CompletableFuture.supplyAsync(() -> metricsOfMongoDB())
                .thenApply(String::valueOf)
                .thenApply(str -> "price " + str)
                .thenAccept(System.out::println);
        // 阻塞住主線程,等待上面執行完
        try {
            System.in.read();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    private static double metricsOfMySQL() {
        sleepRandom();
        return 2.00;
    }

    private static double metricsOfOracle() {
        sleepRandom();
        return 3.00;
    }

    private static double metricsOfMongoDB() {
        sleepRandom();
        return 1.00;
    }

    private static void sleepRandom() {
        int time = new Random().nextInt(500);
        try {
            TimeUnit.MILLISECONDS.sleep(time);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        System.out.printf("After %s sleep!\n", time);
    }
}
}
           

認識ThreadPoolExecutor

最開始我們建立一個線程,執行一個Runnable任務,執行完後就銷毀線程了.

然而建立一個線程需要跟作業系統申請資源,這個過程是比較耗時的;是以我們最好是讓線程複用,即讓一個線程去持續執行不同的任務,而不是執行一個任務後就銷毀.(可以類比一下泡面桶和陶瓷碗)

線程池裡面不僅僅是線程,它維護這兩個集合,一個是線程集合,一個是任務集合.

ThreadPoolExecutor的七個重要參數:

  1. int corePoolSize

    核心線程數,最開始線程池裡面沒有線程,來了任務後會先建立一定數量的核心線程去執行任務;一般沒有任務執行時也不會回收核心線程.

  2. int maximumPoolSize

    最大線程數.當任務比較多,核心線程執行不過來時會放入任務隊列,任務隊列滿了後會建立非核心線程,maximumPoolSize=臨時線程數+核心線程數,主要負責控制臨時線程數.非核心線程在空閑一段時間後會被回收.

  3. long keepAliveTime

    生存時間.當一個非核心線程很長時間不執行任務了,就銷毀該線程,這個參數就是控制空閑門檻值.

    核心線程預設不受此控制,也可以設定參數指定核心線程受此控制(allowCoreThreadTimeOut).

  4. TimeUnit unit

    生存時間機關,見名知意

  5. BlockingQueue workQueue

    任務隊列

  6. ThreadFactory threadFactory

    線程工廠,自定義建立線程的方式.

    有個預設的DefaultThreadFactory,指定了線程名字,daemon=false,priority=5(NORM_PRIORITY).不要小看線程名,多線程環境追蹤錯誤日志時大有用處.

  7. RejectedExecutionHandler handler

    拒絕政策,當任務很多,任務隊列滿了,非核心線程數也達到上限後,再來任務的時候的處理政策.拒絕政策可以自定義,JDK提供了四種拒絕政策:

  • AbortPolicy:抛異常,這也是預設的拒絕政策
  • DiscardPolicy:安靜的丢掉
  • DiscardOldestPolicy:丢掉隊列中最老的任務,把新的放入隊列

    做遊戲的時候可能會用,比如一個角色的每次移動作為一個操作當如線程池中,正常情況是依次移動;當隊列滿了就把最老的丢掉,減少影響.

  • CallerRunsPolicy:送出任務者(調用execute的線程)處理該任務

    (實戰中這四種一般都不用,而是自定義)

阿裡開發手冊1.5.0裡面一丶(六)也講到,很多關于線程的規範,下面列舉幾條:

  1. 線程資源必須通過線程池提供,不允許在應用中自行顯式建立線程。
  2. 線程池不允許使用 Executors 去建立,而是通過ThreadPoolExecutor 的方式,這樣的處理方式讓寫的同學更加明确線程池的運作規則,規避資源耗盡的風險。

    說明:Executors 傳回的線程池對象的弊端如下:

    1) FixedThreadPool 和 SingleThreadPool:

    允許的請求隊列長度為 Integer.MAX_VALUE,可能會堆積大量的請求,進而導緻 OOM。

    2) CachedThreadPool:

    允許的建立線程數量為 Integer.MAX_VALUE,可能會建立大量的線程,進而導緻 OOM。

  3. 建立線程或線程池時請指定有意義的線程名稱,友善出錯時回溯。

測試小例子:

public class T05_00_HelloThreadPool {

    static class Task implements Runnable {
        private int i;

        public Task(int i) {
            this.i = i;
        }

        @Override
        public void run() {
            // 列印一下目前線程
            System.out.println(Thread.currentThread().getName() + " Task " + i);
            try {
                // 阻塞住,以便認識不同的拒絕政策
                TimeUnit.DAYS.sleep(1);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }

        @Override
        public String toString() {
            return "Task{" +
                    "i=" + i +
                    '}';
        }
    }

    public static void main(String[] args) {
        // 初始化一個線程池,最多同時接納8個任務
        ThreadPoolExecutor tpe = new ThreadPoolExecutor(2, 4,
                60, TimeUnit.SECONDS,
                new ArrayBlockingQueue<Runnable>(4),
                Executors.defaultThreadFactory(),
                new ThreadPoolExecutor.CallerRunsPolicy()
        );

        // 把線程池占滿
        for (int i = 0; i < 8; i++) {
            tpe.execute(new Task(i));
        }

        // 列印一下目前線程等待隊列,是線程2,3,4,5;
        // 因為0和1正被核心線程執行,6和7被非核心線程執行
        System.out.println(tpe.getQueue());

        tpe.execute(new Task(100));

        // 如果是DiscardOldestPolicy,會發現任務2被丢掉了,任務100加入等待隊列
        // 如果是CallerRunsPolicy,這句話不會列印,因為新的任務被主線程執行,而任務會阻塞線程;但是會列印main Task 100
        System.out.println("main thread end\n" + tpe.getQueue());

        // 不再接收新任務,等已有任務執行完後關掉線程池
        tpe.shutdown();
        // 嘗試馬上關掉線程池,不等目前任務結束,而是通過Thread.interrupt打斷線程
        // 如果線程沒有正确處理InterruptedException,那就永遠那不會被終結
//        tpe.shutdownNow();
    }
}
           

調整線程池的大小

下面是一個建議,也可以說是标準公式吧,但是這個公式中的等待時間和預估時間的比率很難預估出來,工程中還是需要經過各種情況的壓力測試,然後取一個相對各方面都照顧的到的值.

一般的等待時間都花在IO上,是以W/C比較高時也稱為IO密集型.

JAVA多線程與高并發(七)[線程池的基本概念,ThreadPoolExecutor的簡單使用和源碼解讀]

ThreadPoolExecutor源碼解析

這塊扣起來賊頭疼,我們先領會戰略精神,具體戰術日後再議…

昨天看AQS的源碼,扣了半天沒搞明白,浪費好多時間,還有很多"上天入地"的任務待完成…

這裡補充記錄一點,JAVA(不知道其他語言怎麼說…)中整數的表示形式,以4位的數來說:

1.正整數和0,就是正常的二進制,1就是0001,2就是0010

2.負整數=對應正整數的反碼的補碼,-1反碼->1110補碼->1111,即十進制-1的二進制為1111

1、常用變量的解釋

// 1. `ctl`,可以看做一個int類型的數字,高3位表示線程池狀态,低29位表示worker數量
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
// 2. `COUNT_BITS`,`Integer.SIZE`為32,是以`COUNT_BITS`為29
private static final int COUNT_BITS = Integer.SIZE - 3;
// 3. `CAPACITY`,線程池允許的最大線程數。1左移29位,然後減1,即為 2^29 - 1
private static final int CAPACITY   = (1 << COUNT_BITS) - 1;

// runState is stored in the high-order bits
// 4. 線程池有5種狀态,按大小排序如下:RUNNING < SHUTDOWN < STOP < TIDYING < TERMINATED
private static final int RUNNING    = -1 << COUNT_BITS;
private static final int SHUTDOWN   =  0 << COUNT_BITS;
private static final int STOP       =  1 << COUNT_BITS;
private static final int TIDYING    =  2 << COUNT_BITS;
private static final int TERMINATED =  3 << COUNT_BITS;

// Packing and unpacking ctl
// 5. `runStateOf()`,擷取線程池狀态,通過按位與操作,低29位将全部變成0
private static int runStateOf(int c)     { return c & ~CAPACITY; }
// 6. `workerCountOf()`,擷取線程池worker數量,通過按位與操作,高3位将全部變成0
private static int workerCountOf(int c)  { return c & CAPACITY; }
// 7. `ctlOf()`,根據線程池狀态和線程池worker數量,生成ctl值
private static int ctlOf(int rs, int wc) { return rs | wc; }

/*
 * Bit field accessors that don't require unpacking ctl.
 * These depend on the bit layout and on workerCount being never negative.
 */
// 8. `runStateLessThan()`,線程池狀态小于xx
private static boolean runStateLessThan(int c, int s) {
    return c < s;
}
// 9. `runStateAtLeast()`,線程池狀态大于等于xx
private static boolean runStateAtLeast(int c, int s) {
    return c >= s;
}
           

2、構造方法

public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler) {
    // 基本類型參數校驗
    if (corePoolSize < 0 ||
        maximumPoolSize <= 0 ||
        maximumPoolSize < corePoolSize ||
        keepAliveTime < 0)
        throw new IllegalArgumentException();
    // 空指針校驗
    if (workQueue == null || threadFactory == null || handler == null)
        throw new NullPointerException();
    this.corePoolSize = corePoolSize;
    this.maximumPoolSize = maximumPoolSize;
    this.workQueue = workQueue;
    // 根據傳入參數`unit`和`keepAliveTime`,将存活時間轉換為納秒存到變量`keepAliveTime `中
    this.keepAliveTime = unit.toNanos(keepAliveTime);
    this.threadFactory = threadFactory;
    this.handler = handler;
}
           

3、送出執行task的過程

public void execute(Runnable command) {
    if (command == null)
        throw new NullPointerException();
    /*
     * Proceed in 3 steps:
     *
     * 1. If fewer than corePoolSize threads are running, try to
     * start a new thread with the given command as its first
     * task.  The call to addWorker atomically checks runState and
     * workerCount, and so prevents false alarms that would add
     * threads when it shouldn't, by returning false.
     *
     * 2. If a task can be successfully queued, then we still need
     * to double-check whether we should have added a thread
     * (because existing ones died since last checking) or that
     * the pool shut down since entry into this method. So we
     * recheck state and if necessary roll back the enqueuing if
     * stopped, or start a new thread if there are none.
     *
     * 3. If we cannot queue task, then we try to add a new
     * thread.  If it fails, we know we are shut down or saturated
     * and so reject the task.
     */
    int c = ctl.get();
    // worker數量比核心線程數小,直接建立worker執行任務
    if (workerCountOf(c) < corePoolSize) {
        if (addWorker(command, true))
            return;
        c = ctl.get();
    }
    // worker數量超過核心線程數,任務直接進入隊列
    if (isRunning(c) && workQueue.offer(command)) {
        int recheck = ctl.get();
        // 線程池狀态不是RUNNING狀态,說明執行過shutdown指令,需要對新加入的任務執行reject()操作。
        // 這兒為什麼需要recheck,是因為任務入隊列前後,線程池的狀态可能會發生變化。
        if (! isRunning(recheck) && remove(command))
            reject(command);
        // 這兒為什麼需要判斷0值,主要是線上程池構造方法中,核心線程數允許為0
        else if (workerCountOf(recheck) == 0)
            addWorker(null, false);
    }
    // 如果線程池不是運作狀态,或者任務進入隊列失敗,則嘗試建立worker執行任務。
    // 這兒有3點需要注意:
    // 1. 線程池不是運作狀态時,addWorker内部會判斷線程池狀态
    // 2. addWorker第2個參數表示是否建立核心線程
    // 3. addWorker傳回false,則說明任務執行失敗,需要執行reject操作
    else if (!addWorker(command, false))
        reject(command);
}
           

4、addworker源碼解析

private boolean addWorker(Runnable firstTask, boolean core) {
    retry:
    // 外層自旋
    for (;;) {
        int c = ctl.get();
        int rs = runStateOf(c);

        // 這個條件寫得比較難懂,我對其進行了調整,和下面的條件等價
        // (rs > SHUTDOWN) || 
        // (rs == SHUTDOWN && firstTask != null) || 
        // (rs == SHUTDOWN && workQueue.isEmpty())
        // 1. 線程池狀态大于SHUTDOWN時,直接傳回false
        // 2. 線程池狀态等于SHUTDOWN,且firstTask不為null,直接傳回false
        // 3. 線程池狀态等于SHUTDOWN,且隊列為空,直接傳回false
        // Check if queue empty only if necessary.
        if (rs >= SHUTDOWN &&
            ! (rs == SHUTDOWN &&
               firstTask == null &&
               ! workQueue.isEmpty()))
            return false;

        // 内層自旋
        for (;;) {
            int wc = workerCountOf(c);
            // worker數量超過容量,直接傳回false
            if (wc >= CAPACITY ||
                wc >= (core ? corePoolSize : maximumPoolSize))
                return false;
            // 使用CAS的方式增加worker數量。
            // 若增加成功,則直接跳出外層循環進入到第二部分
            if (compareAndIncrementWorkerCount(c))
                break retry;
            c = ctl.get();  // Re-read ctl
            // 線程池狀态發生變化,對外層循環進行自旋
            if (runStateOf(c) != rs)
                continue retry;
            // 其他情況,直接内層循環進行自旋即可
            // else CAS failed due to workerCount change; retry inner loop
        } 
    }
    boolean workerStarted = false;
    boolean workerAdded = false;
    Worker w = null;
    try {
        w = new Worker(firstTask);
        final Thread t = w.thread;
        if (t != null) {
            final ReentrantLock mainLock = this.mainLock;
            // worker的添加必須是串行的,是以需要加鎖
            mainLock.lock();
            try {
                // Recheck while holding lock.
                // Back out on ThreadFactory failure or if
                // shut down before lock acquired.
                // 這兒需要重新檢查線程池狀态
                int rs = runStateOf(ctl.get());

                if (rs < SHUTDOWN ||
                    (rs == SHUTDOWN && firstTask == null)) {
                    // worker已經調用過了start()方法,則不再建立worker
                    if (t.isAlive()) // precheck that t is startable
                        throw new IllegalThreadStateException();
                    // worker建立并添加到workers成功
                    workers.add(w);
                    // 更新`largestPoolSize`變量
                    int s = workers.size();
                    if (s > largestPoolSize)
                        largestPoolSize = s;
                    workerAdded = true;
                }
            } finally {
                mainLock.unlock();
            }
            // 啟動worker線程
            if (workerAdded) {
                t.start();
                workerStarted = true;
            }
        }
    } finally {
        // worker線程啟動失敗,說明線程池狀态發生了變化(關閉操作被執行),需要進行shutdown相關操作
        if (! workerStarted)
            addWorkerFailed(w);
    }
    return workerStarted;
}
           

5、線程池worker任務單元

private final class Worker
    extends AbstractQueuedSynchronizer
    implements Runnable
{
    /**
     * This class will never be serialized, but we provide a
     * serialVersionUID to suppress a javac warning.
     */
    private static final long serialVersionUID = 6138294804551838833L;

    /** Thread this worker is running in.  Null if factory fails. */
    final Thread thread;
    /** Initial task to run.  Possibly null. */
    Runnable firstTask;
    /** Per-thread task counter */
    volatile long completedTasks;

    /**
     * Creates with given first task and thread from ThreadFactory.
     * @param firstTask the first task (null if none)
     */
    Worker(Runnable firstTask) {
        setState(-1); // inhibit interrupts until runWorker
        this.firstTask = firstTask;
        // 這兒是Worker的關鍵所在,使用了線程工廠建立了一個線程。傳入的參數為目前worker
        this.thread = getThreadFactory().newThread(this);
    }

    /** Delegates main run loop to outer runWorker  */
    public void run() {
        runWorker(this);
    }

    // 省略代碼...
}
           

6、核心線程執行邏輯-runworker

final void runWorker(Worker w) {
    Thread wt = Thread.currentThread();
    Runnable task = w.firstTask;
    w.firstTask = null;
    // 調用unlock()是為了讓外部可以中斷
    w.unlock(); // allow interrupts
    // 這個變量用于判斷是否進入過自旋(while循環)
    boolean completedAbruptly = true;
    try {
        // 這兒是自旋
        // 1. 如果firstTask不為null,則執行firstTask;
        // 2. 如果firstTask為null,則調用getTask()從隊列擷取任務。
        // 3. 阻塞隊列的特性就是:當隊列為空時,目前線程會被阻塞等待
        while (task != null || (task = getTask()) != null) {
            // 這兒對worker進行加鎖,是為了達到下面的目的
            // 1. 降低鎖範圍,提升性能
            // 2. 保證每個worker執行的任務是串行的
            w.lock();
            // If pool is stopping, ensure thread is interrupted;
            // if not, ensure thread is not interrupted.  This
            // requires a recheck in second case to deal with
            // shutdownNow race while clearing interrupt
            // 如果線程池正在停止,則對目前線程進行中斷操作
            if ((runStateAtLeast(ctl.get(), STOP) ||
                 (Thread.interrupted() &&
                  runStateAtLeast(ctl.get(), STOP))) &&
                !wt.isInterrupted())
                wt.interrupt();
            // 執行任務,且在執行前後通過`beforeExecute()`和`afterExecute()`來擴充其功能。
            // 這兩個方法在目前類裡面為空實作。
            try {
                beforeExecute(wt, task);
                Throwable thrown = null;
                try {
                    task.run();
                } catch (RuntimeException x) {
                    thrown = x; throw x;
                } catch (Error x) {
                    thrown = x; throw x;
                } catch (Throwable x) {
                    thrown = x; throw new Error(x);
                } finally {
                    afterExecute(task, thrown);
                }
            } finally {
                // 幫助gc
                task = null;
                // 已完成任務數加一 
                w.completedTasks++;
                w.unlock();
            }
        }
        completedAbruptly = false;
    } finally {
        // 自旋操作被退出,說明線程池正在結束
        processWorkerExit(w, completedAbruptly);
    }
}