天天看點

當 CPU 空閑時它都在做什麼?

當 CPU 空閑時它都在做什麼?

在 上篇文章中 我說了作業系統行為的基本原理是,在任何一個給定的時刻,在一個 CPU 上有且隻有一個任務是活動的。但是,如果 CPU 無事可做的時候,又會是什麼樣的呢?

事實證明,這種情況是非常普遍的,對于絕大多數的個人電腦來說,這确實是一種常态:大量的睡眠程序,它們都在等待某種情況下被喚醒,差不多在 100% 的 CPU 時間中,都處于虛構的“空閑任務”中。事實上,如果一個普通使用者的 CPU 處于持續的繁忙中,它可能意味着有一個錯誤、bug、或者運作了惡意軟體。

因為我們不能違反我們的原理,一些任務需要在一個 CPU 上激活。首先是因為,這是一個良好的設計:持續很長時間去周遊核心,檢查是否有一個活動任務,這種特殊情況是不明智的做法。最好的設計是沒有任何例外的情況。無論何時,你寫一個 if 語句,Nyan Cat 就會喵喵喵。其次,我們需要使用空閑的 CPU 去做一些事情,讓它們充滿活力,你懂得,就是建立天網計劃呗。

是以,保持這種設計的連續性,并領先于那些邪惡計劃一步,作業系統開發者建立了一個空閑任務,當沒有其它任務可做時就排程它去運作。我們可以在 Linux 的 引導過程 中看到,這個空閑任務就是程序 0,它是由計算機打開電源時運作的第一個指令直接派生出來的。它在 rest_init 中初始化,在 init_idle_bootup_task 中初始化空閑排程類scheduling class。

簡而言之,Linux 支援像實時程序、普通使用者程序等等的不同排程類。當選擇一個程序變成活動任務時,這些類按優先級進行查詢。通過這種方式,核反應堆的控制代碼總是優先于 web 浏覽器運作。盡管在通常情況下,這些類傳回 NULL,意味着它們沒有合适的任務需要去運作 —— 它們總是處于睡眠狀态。但是空閑排程類,它是持續運作的,從不會失敗:它總是傳回空閑任務。

好吧,我們來看一下這個空閑任務到底做了些什麼。下面是 cpu_idle_loop,感謝開源能讓我們看到它的代碼:

while () {
    while(!need_resched()) {
        cpuidle_idle_call();
    }
    /*
    [Note: Switch to a different task. We will return to this loop 
    when the idle task is again selected to run.]
    */
    schedule_preempt_disabled();
}
           

我省略了很多的細節,稍後我們将去了解任務切換,但是,如果你閱讀了這些源代碼,你就會找到它的要點:由于這裡不需要重新排程(即改變活動任務),它一直處于空閑狀态。以所經曆的時間來計算,這個循環和其它作業系統中它的“堂兄弟們”相比,在計算的曆史上它是運作的最多的代碼片段。對于 Intel 處理器來說,處于空閑狀态意味着運作着一個 halt 指令:

static inline void native_halt(void)
{
    asm volatile("hlt": : :"memory");
}
           

hlt 指令停止處理器中的代碼執行,并将它置于 halt 的狀态。奇怪的是,全世界各地數以百萬計的 Intel 類的 CPU 們花費大量的時間讓它們處于 halt 的狀态,甚至它們在通電的時候也是如此。這并不是高效、節能的做法,這促使晶片制造商們去開發處理器的深度睡眠狀态,以帶來着更少的功耗和更長休眠時間。核心的 cpuidle 子系統 是這些節能模式能夠産生好處的原因。

現在,一旦我們告訴 CPU 去 halt(睡眠)之後,我們需要以某種方式讓它醒來。如果你讀過 上篇文章《你的作業系統什麼時候運作?》 ,你可能會猜到中斷會參與其中,而事實确實如此。中斷促使 CPU 離開 halt 狀态傳回到激活狀态。是以,将這些拼到一起,下圖是當你閱讀一個完全呈現的 web 網頁時,你的系統主要做的事情:

當 CPU 空閑時它都在做什麼?

除定時器中斷外的其它中斷也會使處理器再次發生變化。如果你再次點選一個 web 頁面就會産生這種變化,例如:你的滑鼠發出一個中斷,它的驅動會處理它,并且因為它産生了一個新的輸入,突然程序就可運作了。在那個時刻, need_resched() 傳回 true,然後空閑任務因你的浏覽器而被踢出而終止運作。

如果我們呆呆地看着這篇文章,而不做任何事情。那麼随着時間的推移,這個空閑循環就像下圖一樣:

當 CPU 空閑時它都在做什麼?

在這個示例中,由核心計劃的定時器中斷會每 4 毫秒發生一次。這就是滴答tick周期。也就是說每秒鐘将有 250 個滴答,是以,這個滴答速率(頻率)是 250 Hz。這是運作在 Intel 處理器上的 Linux 的典型值,而其它作業系統喜歡使用 100 Hz。這是由你建構核心時在 CONFIG_HZ 選項中定義的。

對于一個空閑 CPU 來說,它看起來似乎是個無意義的工作。如果外部世界沒有新的輸入,在你的筆記本電腦的電池耗盡之前,CPU 将始終處于這種每秒鐘被喚醒 250 次的地獄般折磨的小憩中。如果它運作在一個虛拟機中,那我們正在消耗着主控端 CPU 的性能和寶貴的時鐘周期。

在這裡的解決方案是 動态滴答,當 CPU 處于空閑狀态時,定時器中斷被 暫停或重計劃,直到核心知道将有事情要做時(例如,一個程序的定時器可能要在 5 秒内過期,是以,我們不能再繼續睡眠了),定時器中斷才會重新發出。這也被稱為無滴答模式。

最後,假設在一個系統中你有一個活動程序,例如,一個長時間運作的 CPU 密集型任務。那樣幾乎就和一個空閑系統是相同的:這些示意圖仍然是相同的,隻是将空閑任務替換為這個程序,并且相應的描述也是準确的。在那種情況下,每 4 毫秒去中斷一次任務仍然是無意義的:它隻是作業系統的性能抖動,甚至會使你的工作變得更慢而已。Linux 也可以在這種單一程序的場景中停止這種固定速率的滴答,這被稱為 自适應滴答 模式。最終,這種固定速率的滴答可能會 完全消失。

對于閱讀一篇文章來說,CPU 基本是無事可做的。核心的這種空閑行為是作業系統難題的一個重要部分,并且它與我們看到的其它情況非常相似,是以,這将幫助我們了解一個運作中的核心。

本文轉載自(https://linux.cn/article-9303-1.html)

繼續閱讀