天天看點

并發程式設計初探并發程式設計的挑戰

并發程式設計的挑戰

并發程式設計的目的是為了讓程式運作得更快,但是,并不是啟動更多的線程就能讓程式最大限度地并發執行。在進行并發程式設計時,如果希望通過多線程執行任務讓程式運作得更快,會面臨許多挑戰,比如上下文切換的問題、死鎖的問題,以及受限于硬體和軟體的資源限制問題,本章會介紹幾種并發程式設計的挑戰以及解決方案。

1 上下文切換

我們都知道,即使是單核處理器也支援多線程執行代碼,CPU通過時間片(一般是數十ms)配置設定算法來給每個線程配置設定CPU時間讓多線程機制得以實作。因為時間片非常短,是以我們感覺多個線程是同時執行的。

那什麼是上下文切換呢?舉個栗子,當線程A執行到某一步時,此時CPU将時間讓給了線程B進行執行,那麼在切換前,系統會儲存此時線程A所執行任務的狀态,那麼當下一次切換回線程A繼續執行時,就可以再加載這個任務的狀态,并繼續執行下去。像這樣的,任務從儲存到再加載的過程就是一次上下文切換。

1.1 多線程一定快嗎

下方的代碼示範串行和并發執行并累加操作的時間,請分析:下面的代碼并發執行一定比串行執行快嗎?

public class ConcurrencyTest {
    private static final long count = 10000l;

    public static void main(String[] args) throws InterruptedException {
        concurrency();
        serial();
    }

    private static void concurrency() throws InterruptedException {
        long start = System.currentTimeMillis();
        Thread thread = new Thread(new Runnable() {
            @Override
            public void run() {
                int a = 0;
                for (long i = 0; i < count; i++) {
                    a += 5;
                }
            }
        });
        thread.start();
        int b = 0;
        for (long i = 0; i < count; i++) {
            b--;
        }
        long time = System.currentTimeMillis() - start;
        thread.join();
        System.out.println("concurrency :" + time + "ms,b=" + b);
    }

    private static void serial() {
        long start = System.currentTimeMillis();
        int a = 0;
        for (long i = 0; i < count; i++) {
            a += 5;
        }
        int b = 0;
        for (long i = 0; i < count; i++) {
            b--;
        }
        long time = System.currentTimeMillis() - start;
        System.out.println("serial:" + time + "ms,b=" + b + ",a=" + a);
    }
}      

測試結果如下:

并發程式設計初探并發程式設計的挑戰

可以發現,如果累加操作的次數沒有超過百萬次,那麼串行執行結果消耗的時間會比并行執行的時間要少,這是為什麼呢?因為線程有建立和上下文切換的開銷。

是以在有些情況下我們需要盡可能的減少上下文切換的次數。

1.2 如何減少上下文切換

通常有以下幾種方法:

無鎖并發程式設計:多線程競争鎖時,會引起上下文切換,是以多線程處理資料時,可以用一些辦法來避免使用鎖,如将資料的ID按照Hash算法取模分段,不同的線程處理不同段的資料。

CAS算法:Java的Atomic包使用CAS算法來更新資料,而不需要加鎖。

使用最少線程:避免建立不需要的線程,比如任務很少,但是建立了很多線程來處理,這樣會造成大量線程都處于等待狀态。

協程:在單線程裡實作多任務的排程,并在單線程裡維持多個任務間的切換。

2 死鎖

鎖是個非常有用的工具,運用場景非常多,因為它使用起來非常簡單,而且易于了解。但同時它也會帶來一些困擾,那就是可能會引起死鎖,一旦産生死鎖,就會造成系統功能不可用。讓我們先來看一段代碼,這段代碼會引起死鎖,使線程t1和線程t2互相等待對方釋放鎖。

public class DeadLockDemo {
    private static String A = "A";
    private static String B = "B";

    public static void main(String[] args) {
        new DeadLockDemo().deadLock();
    }

    private void deadLock() {
        Thread t1 = new Thread(new Runnable() {
            @Override
            public void run() {
                synchronized (A) {
                    try {
                        Thread.currentThread().sleep(2000);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                    synchronized (B) {
                        System.out.println("1");
                    }
                }
            }
        });
        Thread t2 = new Thread(new Runnable() {
            @Override
            public void run() {
                synchronized (B) {
                    synchronized (A) {
                        System.out.println("2");
                    }
                }
            }
        });
        t1.start();
        t2.start();
    }
}
      

這段代碼隻是作為示範,在實際編碼中不會寫出這樣的代碼。但是,在複雜的場景中,可能會遇到這樣的問題,比如t1拿到鎖之後,因為一些異常情況沒有釋放鎖(死循環)。又或者是t1拿到一個資料庫鎖,釋放鎖的時候抛出了異常,沒釋放掉。

現在我們介紹避免死鎖的幾個常見方法。

2.1 如何避免死鎖

  • 避免一個線程同時擷取多個鎖。
  • 避免一個線程在鎖内同時占用多個資源,盡量保證每個鎖隻占用一個資源。
  • 嘗試使用定時鎖,使用lock.tryLock(timeout)來替代使用内部鎖機制。
  • 對于資料庫鎖,加鎖和解鎖必須在一個資料庫連接配接裡,否則會出現解鎖失敗的情況。

3 資源限制

3.1 什麼是資源限制

資源限制是指在進行并發程式設計時,程式的執行速度受限于計算機硬體資源或軟體資源。例如,伺服器的帶寬隻有2Mb/s,某個資源的下載下傳速度是1Mb/s每秒,系統啟動10個線程下載下傳資源,下載下傳速度不會變10Mb/s,是以在進行并發程式設計時,要考慮這些資源的限制。硬體資源限制有帶寬的上傳/下載下傳速度、硬碟讀寫速度和CPU的處理速度。軟體資源限制有資料庫的連接配接數和socket連接配接數等。

3.2 資源限制引發的問題

在并發程式設計中,将代碼執行速度加快的原則是将代碼中串行執行的部分變成并發執行,但是如果将某段串行的代碼并發執行,因為受限于資源,仍然在串行執行,這時候程式不僅不會加快執行,反而會更慢,因為增加了上下文切換和資源排程的時間。例如,之前看到一段程式使用多線程在辦公網并發地下載下傳和處理資料時,導緻CPU使用率達到100%,幾個小時都不能運作完成任務,後來修改成單線程,一個小時就執行完成了。

3.3 如何解決資源限制的問題

對于硬體資源限制,可以考慮使用叢集并行執行程式。既然單機的資源有限制,那麼就讓程式在多機上運作。比如使用Hadoop或者自己搭建伺服器叢集,不同的機器處理不同的資料。可以通過“資料ID%機器數”,計算得到一個機器編号,然後由對應編号的機器處理這筆資料。

對于軟體資源限制,可以考慮使用資源池将資源複用。比如使用連接配接池将資料庫和Socket連接配接複用,或者在調用對方webservice接口擷取資料時,隻建立一個連接配接。

3.4 在資源限制情況下進行并發程式設計

如何在資源限制的情況下,讓程式執行得更快呢?方法就是,根據不同的資源限制調整程式的并發度,比如下載下傳檔案程式依賴于兩個資源——帶寬和硬碟讀寫速度。有資料庫操作時,涉及資料庫連接配接數,如果SQL語句執行非常快,而線程的數量比資料庫連接配接數大很多,則某些線程會被阻塞,等待資料庫連接配接。