天天看點

看完這篇還不懂高并發中的線程與線程池你來打我

從這篇開始将會開啟高性能、高并發系列,本篇是該系列的開篇,主要關注多線程以及線程池。

一切要從CPU說起

你可能會有疑問,講多線程為什麼要從CPU說起呢?原因很簡單,在這裡沒有那些時髦的概念,你可以更加清晰的看清問題的本質。

CPU并不知道線程、程序之類的概念。

CPU隻知道兩件事:

1. 從記憶體中取出指令

2. 執行指令,然後回到1

看完這篇還不懂高并發中的線程與線程池你來打我

你看,在這裡CPU确實是不知道什麼程序、線程之類的概念。

接下來的問題就是CPU從哪裡取出指令呢?答案是來自一個被稱為Program Counter(簡稱PC)的寄存器,也就是我們熟知的程式計數器,在這裡大家不要把寄存器想的太神秘,你可以簡單的把寄存器了解為記憶體,隻不過存取速度更快而已。

PC寄存器中存放的是什麼呢?這裡存放的是指令在記憶體中的位址,什麼指令呢?是CPU将要執行的下一條指令。

看完這篇還不懂高并發中的線程與線程池你來打我
看完這篇還不懂高并發中的線程與線程池你來打我

那麼是誰來設定PC寄存器中的指令位址呢?

原來PC寄存器中的位址預設是自動加1的,這當然是有道理的,因為大部分情況下CPU都是一條接一條順序執行,當遇到if、else時,這種順序執行就被打破了,CPU在執行這類指令時會根據計算結果來動态改變PC寄存器中的值,這樣CPU就可以正确的跳轉到需要執行的指令了。

聰明的你一定會問,那麼PC中的初始值是怎麼被設定的呢?

在回答這個問題之前我們需要知道CPU執行的指令來自哪裡?是來自記憶體,廢話,記憶體中的指令是從磁盤中儲存的可執行程式加載過來的,磁盤中可執行程式是編譯器生成的,編譯器又是從哪裡生成的機器指令呢?答案就是我們定義的函數。

看完這篇還不懂高并發中的線程與線程池你來打我

注意是函數,函數被編譯後才會形成CPU執行的指令,那麼很自然的,我們該如何讓CPU執行一個函數呢?顯然我們隻需要找到函數被編譯後形成的第一條指令就可以了,第一條指令就是函數入口。

現在你應該知道了吧,我們想要CPU執行一個函數,那麼隻需要把該函數對應的第一條機器指令的位址寫入PC寄存器就可以了,這樣我們寫的函數就開始被CPU執行起來啦。

你可能會有疑問,這和線程有什麼關系呢?

從CPU到作業系統

上一小節中我們明白了CPU的工作原理,我們想讓CPU執行某個函數,那麼隻需要把函數對應的第一條機器執行裝入PC寄存器就可以了,這樣即使沒有作業系統我們也可以讓CPU執行程式,雖然可行但這是一個非常繁瑣的過程,我們需要:

  • 在記憶體中找到一塊大小合适的區域裝入程式
  • 找到函數入口,設定好PC寄存器讓CPU開始執行程式

這兩個步驟絕不是那麼容易的事情,如果每次在執行程式時程式員自己手動實作上述兩個過程會瘋掉的,是以聰明的程式員就會想幹脆直接寫個程式來自動完成上面兩個步驟吧。

看完這篇還不懂高并發中的線程與線程池你來打我

機器指令需要加載到記憶體中執行,是以需要記錄下記憶體的起始位址和長度;同時要找到函數的入口位址并寫到PC寄存器中,想一想這是不是需要一個資料結構來記錄下這些資訊:

接下來就是起名字時刻。

這個資料結構總要有個名字吧,這個結構體用來記錄什麼資訊呢?記錄的是程式在被加載到記憶體中的運作狀态,程式從磁盤加載到記憶體跑起來叫什麼好呢?幹脆就叫程序(Process)好了,我們的指導原則就是一定要聽上去比較神秘,總之大家都不容易弄懂就對了,我将其稱為“弄不懂原則”。

就這樣程序誕生了。

CPU執行的第一個函數也起個名字,第一個要被執行的函數聽起來比較重要,幹脆就叫main函數吧。

完成上述兩個步驟的程式也要起個名字,根據“弄不懂原則”這個“簡單”的程式就叫作業系統(Operating System)好啦。

就這樣作業系統誕生了,程式員要想運作程式再也不用自己手動加載一遍了。

現在程序和作業系統都有了,一切看上去都很完美。

從單核到多核,如何充分利用多核

人類的一大特點就是生命不息折騰不止,從單核折騰到了多核。

看完這篇還不懂高并發中的線程與線程池你來打我

這時,假設我們想寫一個程式并且要分利用多核該怎麼辦呢?

有的同學可能會說不是有程序嗎,多開幾個程序不就可以了?聽上去似乎很有道理,但是主要存在這樣幾個問題:

  • 程序是需要占用記憶體空間的(從上一節能看到這一點),如果多個程序基于同一個可執行程式,那麼這些程序其記憶體區域中的内容幾乎完全相同,這顯然會造成記憶體的浪費
  • 計算機處理的任務可能是比較複雜的,這就涉及到了程序間通信,由于各個程序處于不同的記憶體位址空間,程序間通信天然需要借助作業系統,這就在增大程式設計難度的同時也增加了系統開銷

該怎麼辦呢?

從程序到線程

讓我再來仔細的想一想這個問題,所謂程序無非就是記憶體中的一段區域,這段區域中儲存了CPU執行的機器指令以及函數運作時的堆棧資訊,要想讓程序運作,就把main函數的第一條機器指令位址寫入PC寄存器,這樣程序就運作起來了。

看完這篇還不懂高并發中的線程與線程池你來打我

程序的缺點在于隻有一個入口函數,也就是main函數,是以程序中的機器指令隻能被一個CPU執行,那麼有沒有辦法讓多個CPU來執行同一個程序中的機器指令呢?

聰明的你應該能想到,既然我們可以把main函數的第一條指令位址寫入PC寄存器,那麼其它函數和main函數又有什麼差別呢?

答案是沒什麼差別,main函數的特殊之處無非就在于是CPU執行的第一個函數,除此之外再無特别之處,我們可以把PC寄存器指向main函數,就可以把PC寄存器指向任何一個函數。

當我們把PC寄存器指向非main函數時,線程就誕生了。

看完這篇還不懂高并發中的線程與線程池你來打我

至此我們解放了思想,一個程序内可以有多個入口函數,也就是說屬于同一個程序中的機器指令可以被多個CPU同時執行。

注意,這是一個和程序不同的概念,建立程序時我們需要在記憶體中找到一塊合适的區域以裝入程序,然後把CPU的PC寄存器指向main函數,也就是說程序中隻有一個執行流。

看完這篇還不懂高并發中的線程與線程池你來打我

但是現在不一樣了,多個CPU可以在同一個屋檐下(程序占用的記憶體區域)同時執行屬于該程序的多個入口函數,也就是說現在一個程序内可以有多個執行流了。

看完這篇還不懂高并發中的線程與線程池你來打我

總是叫執行流好像有點太容易了解了,再次祭出”弄不懂原則“,起個不容易懂的名字,就叫線程吧。

這就是線程的由來。

作業系統為每個程序維護了一堆資訊,用來記錄程序所處的記憶體空間等,這堆資訊記為資料集A。

同樣的,作業系統也需要為線程維護一堆資訊,用來記錄線程的入口函數或者棧資訊等,這堆資料記為資料集B。

顯然資料集B要比資料A的量要少,同時不像程序,建立一個線程時無需去記憶體中找一段記憶體空間,因為線程是運作在所處程序的位址空間的,這塊位址空間在程式啟動時已經建立完畢,同時線程是程式在運作期間建立的(程序啟動後),是以當線程開始運作的時候這塊位址空間就已經存在了,線程可以直接使用。這就是為什麼各種教材上提的建立線程要比建立程序快的原因(當然還有其它原因)。

值得注意的是,有了線程這個概念後,我們隻需要程序開啟後建立多個線程就可以讓所有CPU都忙起來,這就是所謂高性能、高并發的根本所在。

看完這篇還不懂高并發中的線程與線程池你來打我

很簡單,隻需要建立出數量合适的線程就可以了。

另外值得注意的一點是,由于各個線程共享程序的記憶體位址空間,是以線程之間的通信無需借助作業系統,這給程式員帶來極大友善的同時也帶來了無盡的麻煩,多線程遇到的多數問題都出自于線程間通信簡直太友善了以至于非常容易出錯。出錯的根源在于CPU執行指令時根本沒有線程的概念,多線程程式設計面臨的互斥與同步問題需要程式員自己解決,關于互斥與同步問題限于篇幅就不詳細展開了,大部分的作業系統資料都有詳細講解。

最後需要提醒的是,雖然前面關于線程講解使用的圖中用了多個CPU,但不是說一定要有多核才能使用多線程,在單核的情況下一樣可以建立出多個線程,原因在于線程是作業系統層面的實作,和有多少個核心是沒有關系的,CPU在執行機器指令時也意識不到執行的機器指令屬于哪個線程。即使在隻有一個CPU的情況下,作業系統也可以通過線程排程讓各個線程“同時”向前推進,方法就是将CPU的時間片在各個線程之間來回配置設定,這樣多個線程看起來就是“同時”運作了,但實際上任意時刻還是隻有一個線程在運作。

線程與記憶體在前面的讨論中我們知道了線程和CPU的關系,也就是把CPU的PC寄存器指向線程的入口函數,這樣線程就可以運作起來了,這就是為什麼我們建立線程時必須指定一個入口函數的原因。無論使用任何程式設計語言,建立一個線程大體相同:

// 設定線程入口函數DoSomething              thread = CreateThread(DoSomething);              // 讓線程運作起來              thread.Run();
           

那麼線程和記憶體又有什麼關聯呢?

我們知道函數在被執行的時産生的資料包括函數參數、局部變量、傳回位址等資訊,這些資訊是儲存在棧中的,線程這個概念還沒有出現時程序中隻有一個執行流,是以隻有一個棧,這個棧的棧底就是程序的入口函數,也就是main函數,假設main函數調用了funA,funcA又調用了funcB,如圖所示:

看完這篇還不懂高并發中的線程與線程池你來打我

那麼有了線程以後了呢?

有了線程以後一個程序中就存在多個執行入口,即同時存在多個執行流,那麼隻有一個執行流的程序需要一個棧來儲存運作時資訊,那麼很顯然有多個執行流時就需要有多個棧來儲存各個執行流的資訊,也就是說作業系統要為每個線程在程序的位址空間中配置設定一個棧,即每個線程都有獨屬于自己的棧,能意識到這一點是極其關鍵的。

看完這篇還不懂高并發中的線程與線程池你來打我

同時我們也可以看到,建立線程是要消耗程序記憶體空間的,這一點也值得注意。

線程的使用

現在有了線程的概念,那麼接下來作為程式員我們該如何使用線程呢?

從生命周期的角度講,線程要處理的任務有兩類:長任務和短任務。

1,長任務,long-lived tasks

顧名思義,就是任務存活的時間很長,比如以我們常用的word為例,我們在word中編輯的文字需要儲存在磁盤上,往磁盤上寫資料就是一個任務,那麼這時一個比較好的方法就是專門建立一個寫磁盤的線程,該寫線程的生命周期和word程序是一樣的,隻要打開word就要建立出該寫線程,當使用者關閉word時該線程才會被銷毀,這就是長任務。

看完這篇還不懂高并發中的線程與線程池你來打我

這種場景非常适合建立專用的線程來處理某些特定任務,這種情況比較簡單。

有長任務,相應的就有短任務。

2,短任務,short-lived tasks

這個概念也很簡單,那就是任務的處理時間很短,比如一次網絡請求、一次資料庫查詢等,這種任務可以在短時間内快速處理完成。是以短任務多見于各種Server,像web server、database server、file server、mail server等,這也是網際網路行業的同學最常見的場景,這種場景是我們要重點讨論的。

這種場景有兩個特點:一個是任務處理所需時間短;另一個是任務數量巨大。

如果讓你來處理這種類型的任務該怎麼辦呢?

你可能會想,這很簡單啊,當server接收到一個請求後就建立一個線程來處理任務,處理完成後銷毀該線程即可,So easy。

這種方法通常被稱為thread-per-request,也就是說來一個請求就建立一個線程:

看完這篇還不懂高并發中的線程與線程池你來打我

如果是長任務,那麼這種方法可以工作的很好,但是對于大量的短任務這種方法雖然實作簡單但是有這樣幾個缺點:

1. 從前幾節我們能看到,線程是作業系統中的概念(這裡不讨論使用者态線程實作、協程之類),是以建立線程天然需要借助作業系統來完成,作業系統建立和銷毀線程是需要消耗時間的

2. 每個線程需要有自己獨立的棧,是以當建立大量線程時會消耗過多的記憶體等系統資源

這就好比你是一個工廠老闆(想想都很開心有沒有),手裡有很多訂單,每來一批訂單就要招一批勞工,生産的産品非常簡單,勞工們很快就能處理完,處理完這批訂單後就把這些千辛萬苦招過來的勞工辭退掉,當有新的訂單時你再千辛萬苦的招一遍勞工,幹活兒5分鐘招人10小時,如果你不是勵志要讓企業倒閉的話大概是不會這麼做到的,是以一個更好的政策就是招一批人後就地養着,有訂單時處理訂單,沒有訂單時大家可以閑呆着。

這就是線程池的由來。

從多線程到線程池

線程池的概念是非常簡單的,無非就是建立一批線程,之後就不再釋放了,有任務就送出給這些線程處理,是以無需頻繁的建立、銷毀線程,同時由于線程池中的線程個數通常是固定的,也不會消耗過多的記憶體,是以這裡的思想就是複用、可控。

線程池是如何工作的

可能有的同學會問,該怎麼給線程池送出任務呢?這些任務又是怎麼給到線程池中線程呢?

很顯然,資料結構中的隊列天然适合這種場景,送出任務的就是生産者,消費任務的線程就是消費者,實際上這就是經典的生産者-消費者問題。

看完這篇還不懂高并發中的線程與線程池你來打我

現在你應該知道為什麼作業系統課程要講、面試要問這個問題了吧,因為如果你對生産者-消費者問題不了解的話,本質上你是無法正确的寫出線程池的。

限于篇幅在這裡部落客不打算詳細的講解生産者消費者問題,參考作業系統相關資料就能擷取答案。這裡部落客打算講一講一般送出給線程池的任務是什麼樣子的。

一般來說送出給線程池的任務包含兩部分:1) 需要被處理的資料;2) 處理資料的函數

struct task {              void* data;     // 任務所攜帶的資料              handler handle; // 處理資料的方法              }
           

(注意,你也可以把代碼中的struct了解成class,也就是對象。)

線程池中的線程會阻塞在隊列上,當生産者向隊列中寫入資料後,線程池中的某個線程會被喚醒,該線程從隊列中取出上述結構體(或者對象),以結構體(或者對象)中的資料為參數并調用處理函數:

while(true) {              struct task = GetFromQueue(); // 從隊列中取出資料              task->handle(task->data);     // 處理資料              }
           

以上就是線程池最核心的部分。

了解這些你就能明白線程池是如何工作的了。

線程池中線程的數量

現線上程池有了,那麼線程池中線程的數量該是多少呢?

在接着往下看前先自己想一想這個問題。

如果你能看到這裡說明還沒有睡着。

要知道線程池的線程過少就不能充分利用CPU,線程建立的過多反而會造成系統性能下降,記憶體占用過多,線程切換造成的消耗等等。是以線程的數量既不能太多也不能太少,那到底該是多少呢?

回答這個問題,你需要知道線程池處理的任務有哪幾類,有的同學可能會說你不是說有兩類嗎?長任務和短任務,這個是從生命周期的角度來看的,那麼從處理任務所需要的資源角度看也有兩種類型,這就是沒事兒找抽型和。。啊不,是CPU密集型和I/O密集型。

1,CPU密集型

所謂CPU密集型就是說處理任務不需要依賴外部I/O,比如科學計算、矩陣運算等等。在這種情況下隻要線程的數量和核數基本相同就可以充分利用CPU資源。

看完這篇還不懂高并發中的線程與線程池你來打我

2,I/O密集型

這一類任務可能計算部分所占用時間不多,大部分時間都用在了比如磁盤I/O、網絡I/O等。

看完這篇還不懂高并發中的線程與線程池你來打我

這種情況下就稍微複雜一些了,你需要利用性能測試工具評估出用在I/O等待上的時間,這裡記為WT(wait time),以及CPU計算所需要的時間,這裡記為CT(computing time),那麼對于一個N核的系統,合适的線程數大概是N * (1 + WT/CT),假設I/O等待時間和計算時間相同,那麼你大概需要2N個線程才能充分利用CPU資源,注意這隻是一個理論值,具體設定多少需要根據真實的業務場景進行測試。

當然充分利用CPU不是唯一需要考慮的點,随着線程數量的增多,記憶體占用、系統排程、打開的檔案數量、打開的socker數量以及打開的資料庫連結等等是都需要考慮的。

是以這裡沒有萬能公式,要具體情況具體分析。

線程池不是萬能的

線程池僅僅是多線程的一種使用形式,是以多線程面臨的問題線程池同樣不能避免,像死鎖問題、race condition問題等等,關于這一部分同樣可以參考作業系統相關資料就能得到答案,是以基礎很重要呀老鐵們。

線程池使用的最佳實踐

線程池是程式員手中強大的武器,網際網路公司的各個server上幾乎都能見到線程池的身影,使用線程池前你需要考慮:

  • 充分了解你的任務,是長任務還是短任務、是CPU密集型還是I/O密集型,如果兩種都有,那麼一種可能更好的辦法是把這兩類任務放到不同的線程池中,這樣也許可以更好的确定線程數量
  • 如果線程池中的任務有I/O操作,那麼務必對此任務設定逾時,否則處理該任務的線程可能會一直阻塞下去
  • 線程池中的任務最好不要同步等待其它任務的結果

總結

本節我們從CPU開始一路來到常用的線程池,從底層到上層、從硬體到軟體。注意,這裡通篇沒有出現任何特定的程式設計語言,線程不是語言層面的概念(依然不考慮使用者态線程),但是當你真正了解了線程後,相信你可以在任何一門語言下用好多線程,你需要了解的是道,此後才是術。

希望這篇文章對大家了解線程以及線程池有所幫助。

接下的一篇将是與線程池密切配合實作高性能、高并發的又一關鍵技術:I/O與I/O多路複用,敬請期待。

更多精彩内容,歡迎關注公衆号“碼農的荒島求生”。

看完這篇還不懂高并發中的線程與線程池你來打我