天天看點

管理處理器的親和性(affinity)

簡單地說,CPU 親和性(affinity) 就是程序要在某個給定的 CPU 上盡量長時間地運作而不被遷移到其他處理器的傾向性。Linux 核心程序排程器天生就具有被稱為 軟 CPU 親和性(affinity) 的特性,這意味着程序通常不會在處理器之間頻繁遷移。這種狀态正是我們希望的,因為程序遷移的頻率小就意味着産生的負載小。

2.6 版本的 Linux 核心還包含了一種機制,它讓開發人員可以程式設計實作 硬 CPU 親和性(affinity)。這意味着應用程式可以顯式地指定程序在哪個(或哪些)處理器上運作。

<a>什麼是 Linux 核心硬親和性(affinity)?</a>

在 Linux 核心中,所有的程序都有一個相關的資料結構,稱為 <code>task_struct</code>。這個結構非常重要,原因有很多;其中與 親和性(affinity)相關度最高的是 <code>cpus_allowed</code> 位掩碼。這個位掩碼由 n 位組成,與系統中的 n 個邏輯處理器一一對應。 具有 4 個實體 CPU 的系統可以有 4 位。如果這些 CPU 都啟用了超線程,那麼這個系統就有一個 8 位的位掩碼。

如果為給定的程序設定了給定的位,那麼這個程序就可以在相關的 CPU 上運作。是以,如果一個程序可以在任何 CPU 上運作,并且能夠根據需要在處理器之間進行遷移,那麼位掩碼就全是 1。實際上,這就是 Linux 中程序的預設狀态。

Linux 核心 API 提供了一些方法,讓使用者可以修改位掩碼或檢視目前的位掩碼:

<code>sched_set_affinity()</code> (用來修改位掩碼)

<code>sched_get_affinity()</code> (用來檢視目前的位掩碼)

注意,<code>cpu_affinity</code> 會被傳遞給子線程,是以應該适當地調用 <code>sched_set_affinity</code>。

<a>為什麼應該使用硬親和性(affinity)?</a>

通常 Linux 核心都可以很好地對程序進行排程,在應該運作的地方運作程序(這就是說,在可用的處理器上運作并獲得很好的整體性能)。核心包含了一些用來檢測 CPU 之間任務負載遷移的算法,可以啟用程序遷移來降低繁忙的處理器的壓力。

一般情況下,在應用程式中隻需使用預設的排程器行為。然而,您可能會希望修改這些預設行為以實作性能的優化。讓我們來看一下使用硬親和性(affinity) 的 3 個原因。

<a>原因 1. 有大量計算要做</a>

基于大量計算的情形通常出現在科學和理論計算中,但是通用領域的計算也可能出現這種情況。一個常見的标志是您發現自己的應用程式要在多處理器的機器上花費大量的計算時間。

<a>原因 2. 您在測試複雜的應用程式</a>

測試複雜軟體是我們對核心的親和性(affinity)技術感興趣的另外一個原因。考慮一個需要進行線性可伸縮性測試的應用程式。有些産品聲明可以在 使用更多硬體 時執行得更好。

我們不用購買多台機器(為每種處理器配置都購買一台機器),而是可以:

購買一台多處理器的機器

不斷增加配置設定的處理器

測量每秒的事務數

評估結果的可伸縮性

如果應用程式随着 CPU 的增加可以線性地伸縮,那麼每秒事務數和 CPU 個數之間應該會是線性的關系(例如斜線圖 —— 請參閱下一節的内容)。這樣模組化可以确定應用程式是否可以有效地使用底層硬體。

Amdahl 法則是有關使用并行處理器來解決問題相對于隻使用一個串行處理器來解決問題的加速比的法則。加速比(Speedup) 等于串行執行(隻使用一個處理器)的時間除以程式并行執行(使用多個處理器)的時間:

其中 <code>T(j)</code> 是在使用 <code>j</code> 個處理器執行程式時所花費的時間。

Amdahl 法則說明這種加速比在現實中可能并不會發生,但是可以非常接近于該值。對于通常情況來說,我們可以推論出每個程式都有一些串行的元件。随着問題集不斷變大,串行元件最終會在優化解決方案時間方面達到一個上限。

Amdahl 法則在希望保持高 CPU 緩存命中率時尤其重要。如果一個給定的程序遷移到其他地方去了,那麼它就失去了利用 CPU 緩存的優勢。實際上,如果正在使用的 CPU 需要為自己緩存一些特殊的資料,那麼所有其他 CPU 都會使這些資料在自己的緩存中失效。

是以,如果有多個線程都需要相同的資料,那麼将這些線程綁定到一個特定的 CPU 上是非常有意義的,這樣就確定它們可以通路相同的緩存資料(或者至少可以提高緩存的命中率)。否則,這些線程可能會在不同的 CPU 上執行,這樣會頻繁地使其他緩存項失效。

<a>原因 3. 您正在運作時間敏感的、決定性的程序</a>

我們對 CPU 親和性(affinity)感興趣的最後一個原因是實時(對時間敏感的)程序。例如,您可能會希望使用硬親和性(affinity)來指定一個 8 路主機上的某個處理器,而同時允許其他 7 個處理器處理所有普通的系統排程。這種做法確定長時間運作、對時間敏感的應用程式可以得到運作,同時可以允許其他應用程式獨占其餘的計算資源。

下面的樣例應用程式顯示了這是如何工作的。

<a>如何利用硬親和性(affinity)</a>

<a>清單 1. 讓處理器繁忙</a>

正如您可以看到的一樣,這段代碼隻是通過 fork 調用簡單地建立一組線程。每個線程都執行這個方法中後面的代碼。現在我們讓每個線程都将親和性(affinity)設定為自己的 CPU。

<a>清單 2. 為每個線程設定 CPU 親和性(affinity)</a>

如果程式可以執行到這兒,那麼我們的線程就已經設定了自己的親和性(affinity)。調用 <code>sched_setaffinity</code> 會設定由 <code>pid</code> 所引用的程序的 CPU 親和性(affinity)掩碼。如果 <code>pid</code> 為 0,那麼就使用目前程序。

親和性(affinity)掩碼是使用在 <code>mask</code> 中存儲的位掩碼來表示的。最低位對應于系統中的第一個邏輯處理器,而最高位則對應于系統中最後一個邏輯處理器。

每個設定的位都對應一個可以合法排程的 CPU,而未設定的位則對應一個不可排程的 CPU。換而言之,程序都被綁定了,隻能在那些對應位被設定了的處理器上運作。通常,掩碼中的所有位都被置位了。這些線程的親和性(affinity)都會傳遞給從它們派生的子程序中。

注意不應該直接修改位掩碼。應該使用下面的宏。雖然在我們的例子中并沒有全部使用這些宏,但是在本文中還是詳細列出了這些宏,您在自己的程式中可能需要這些宏。

<a>清單 3. 間接修改位掩碼的宏</a>

對于本文來說,樣例代碼會繼續讓每個線程都執行某些計算量較大的操作。

<a>清單 4. 每個線程都執行一個計算敏感的操作</a>

現在您已經了解了在 Linux 2.6 版本的核心中設定 CPU 親和性(affinity)的基本知識。接下來,我們使用一個 <code>main</code> 程式來封裝這些方法,它使用一個使用者指定的參數來說明要讓多少個 CPU 繁忙。我們可以使用另外一個方法來确定系統中有多少個處理器:

<code>int NUM_PROCS = sysconf(_SC_NPROCESSORS_CONF);</code>

這個方法讓程式能夠自己确定要讓多少個處理器保持繁忙,例如預設讓所有的處理器都處于繁忙狀态,并允許使用者指定系統中實際處理器範圍的一個子集。

<a>運作樣例程式</a>

<a>結束語</a>

這個樣例程式雖然非常簡單,但是它卻展示了使用 Linux 核心中實作的硬親和性(affinity)的基本知識。(任何使用這段代碼的應用程式都無疑會做一些更有意義的事情。)了解了 CPU 親和性(affinity)核心 API 的基本知識,您就可以從複雜的應用程式中榨取出最後一點兒性能了。

<a>下載下傳</a>

描述

名字

大小

下載下傳方法

Sample app using CPU affinity kernel API

thrasher.zip

3 KB

<a href="http://www.ibm.com/developerworks/apps/download/index.jsp?contentid=99000&amp;filename=thrasher.zip&amp;method=ftp&amp;locale=zh_CN">FTP</a>

<a href="http://www.ibm.com/developerworks/cn/whichmethod.html">關于下載下傳方法的資訊</a>

繼續閱讀