天天看點

Linux核心jiffies簡介 - AlanTu

Linux核心jiffies簡介

在LINUX的時鐘中斷中涉及至二個全局變量一個是xtime,它是timeval資料結構變量,另一個則是jiffies,首先看timeval結構

struct timeval

{

time_t tv_sec; /***second***/

susecond_t tv_usec;/***microsecond***/

}

到底microsecond是毫秒還是微秒??

1秒=1000毫秒(3個零),1秒=1000 000微秒(6個零),1秒=1000 000 000納秒(9個零),1秒=1000 000 000 000皮秒(12個零)。

秒用s表現,毫秒用ms,微秒用us表示,納秒用ns表示,皮秒用ps表示,他們的分級機關是千,即每次3個零。

混淆的原因找到了,由于毫秒用ms表示,是以我老是以為microsecond是毫秒,是以就把tv_usec了解錯了。

microsecond查詞霸也是微秒的意思(microsecond!=ms,microsecond==us),看來機關的表示迷惑了我,也迷惑了大多數人,請朋友們牢記這裡,非常重要。

xtime是從cmos電路中取得的時間,一般是從某一曆史時刻開始到現在的時間,也就是為了取得我們作業系統上顯示的日期。這個就是所謂的“實時時鐘”,它的精确度是微秒。

jiffies是記錄着從電腦開機到現在總共的時鐘中斷次數。在linux核心中jiffies遠比xtime重要,那麼他取決于系統的頻率,機關是Hz,這裡不得不說一下頻率的機關,1MHz=1000,000Hz(6個零),1KHz=1000Hz(3個零).

率是周期的倒數,一般是一秒鐘中斷産生的次數,是以,假如我們需要知道系統的精确的時間機關時,需要換算了,假如我們系統的頻率是200Mhz,那麼一次

中斷的間隔是1秒/200,000,000Hz=0.000 000

005秒看一下上面我們的時間機關,對照一下小數點後面是9個零,是以理論上我們系統的精确度是5納秒。LINUX系統時鐘頻率是一個常數HZ來決定的,

通常HZ=100,那麼他的精度度就是10ms(毫秒)。也就是說每10ms一次中斷。是以一般來說Linux的精确度是10毫秒。

硬體給核心提供一個系統定時器用以計算和管理時間,核心通過程式設計預設系統定時器的頻率,即節拍率(tick rate),每一個周期稱作一個tick(節拍)。Linux核心從2.5版核心開始把頻率從100調高到1000,時間機關 jiffies 有多長?

"在 Linux 2.6 中,系統時鐘每 1 毫秒中斷一次(時鐘頻率,用 HZ 宏表示,定義為 1000,即每秒中斷 1000 次,2.4 中定義為 100,很多應用程式也仍然沿用 100 的時鐘頻率),這個時間機關稱為一個 jiffie。"

"jiffies 與絕對時間之間的轉換, 用兩個宏來完成兩種時間機關的互換:JIFFIES_TO_NS()、NS_TO_JIFFIES()"

(當然帶來了很多優點,也有一些缺點).

硬體給核心提供一個系統定時器用以計算和管理時間,核心通過程式設計預設系統定時器的頻率,即節拍率(tick rate),每一個周期稱作一個tick(節拍)。Linux核心從2.5版核心開始把頻率從100調高到1000(當然帶來了很多優點,也有一些缺點).

   jiffies是核心中的一個全局變量,用來記錄自系統啟動一來産生的節拍數。譬如,如果計算系統運作了多長時間,可以用 jiffies/tick rate 來計算。jiffies定義在檔案<linux/jiffies.h>中:

extern unsigned long volatile jiffies;

    可以利用jiffies設定逾時等,譬如:

unsigned long timeout = jiffies + tick_rate * 2; // 2秒鐘後逾時

    if(time_before(jiffies, timeout){

       // 還沒有逾時

    }

    else{

       // 已經逾時

    }

核心提供了四個宏來比較節拍計數,這些宏定義在檔案<linux/jiffies.h>中:

    time_before(unknown, known)

    time_after(unknown, known)

    time_before_eq(unknown, known)

    time_after_eq(unknown, known)

    比較的時候用這些宏可以避免jiffies由于過大造成的回繞問題。

除了系統定時器外,還有一個與時間有關的時鐘:實時時鐘(RTC),這是一個硬體時鐘,用來持久存放系統時間,系統關閉後靠主機闆上的微型電池保持計時。系

統啟動時,核心通過讀取RTC來初始化Wall Time,并存放在xtime變量中,這是RTC最主要的作用。

///////////////////////////////////////////////////////////////////網絡相關函

數内容詳解

//////////////////////////////////////////////////////////////////////

1.linux HZ 

Linux核心幾個重要跟時間有關的名詞或變數,以下将介紹HZ、tick與jiffies。

HZ

Linux 核心每隔固定周期會發出timer interrupt (IRQ 0),HZ是用來定義每一秒有幾次timer

interrupts。舉例來說,HZ為1000,代表每秒有1000次timer interrupts。

HZ可在編譯核心時設定,如下所示(以核心版本2.6.20-15為例):

adrian@adrian-desktop:~$ cd /usr/src/linux

adrian@adrian-desktop:/usr/src/linux$ make menuconfig

Processor type and features ---> Timer frequency (250 HZ) --->

其中HZ可設定100、250、300或1000。

小實驗

觀察/proc/interrupt的timer中斷次數,并于一秒後再次觀察其值。理論上,兩者應該相差250左右。

adrian@adrian-desktop:~$ cat /proc/interrupts | grep timer && sleep 1 && cat /proc/interrupts | grep timer

0: 9309306 IO-APIC-edge timer

0: 9309562 IO-APIC-edge timer

上面四個欄位分别為中斷号碼、CPU中斷次數、PIC與裝置名稱。

要檢查系統上HZ的值是什麼,就執行指令

cat kernel/.config | grep \'^CONFIG_HZ=\'

2.Tick 

Tick是HZ的倒數,意即timer interrupt每發生一次中斷的時間。如HZ為250時,tick為4毫秒(millisecond)。

3.Jiffies 

Jiffies 為Linux核心變數(unsigned long),它被用來記錄系統自開機以來,已經過了多少tick。每發生一次timer

interrupt,Jiffies變數會被加一。值得注意的是,Jiffies于系統開機時,并非初始化成零,而是被設為-300*HZ

(arch/i386/kernel/time.c),即代表系統于開機五分鐘後,jiffies便會溢位。那溢位怎麼辦?事實上,Linux核心定義幾

個macro(timer_after、time_after_eq、time_before與time_before_eq),即便是溢位,也能借由這

幾個macro正确地取得jiffies的内容。

另外,80x86架構定義一個與jiffies相關的變數jiffies_64 ,此變數64位元,要等到此變數溢位可能要好幾百萬年。是以要等到溢位這刻發生應該很難吧。

3.1 jiffies及其溢出

全局變量jiffies取值為自作業系統啟動以來的時鐘滴答的數目,在頭檔案<linux/sched.h>中定義,資料類型為unsigned long volatile (32位無符号長整型)。

jiffies轉換為秒可采用公式:(jiffies/HZ)計算,

将秒轉換為jiffies可采用公式:(seconds*HZ)計算。

當 時鐘中斷發生時,jiffies

值就加1。是以連續累加一年又四個多月後就會溢出(假定HZ=100,1個jiffies等于1/100秒,jiffies可記錄的最大秒數為

(2^32 -1)/100=42949672.95秒,約合497天或1.38年),即當取值到達最大值時繼續加1,就變為了0。

3.4  Linux核心如何來防止jiffies溢出

Linux核心中提供了以下四個宏,可有效解決由于jiffies溢出而造成程式邏輯出錯的情況。下面是從Linux Kernel 2.6.7版本中摘取出來的代碼:

/*

* These inlines deal with timer wrapping correctly. You are

* strongly encouraged to use them

* 1. Because people otherwise forget

* 2. Because if the timer wrap changes in future you won\'t have to

* alter your driver code.

*

* time_after(a,b) returns true if the time a is after time b.

*

* Do this with "<0" and ">=0" to only test the sign of the result. A

* good compiler would generate better code (and a really good compiler

* wouldn\'t care). Gcc is currently neither.

*/

#define time_after(a,b) \

(typecheck(unsigned long, a) && \

typecheck(unsigned long, b) && \

((long)(b) - (long)(a) < 0))

#define time_before(a,b) time_after(b,a)

#define time_after_eq(a,b) \

(typecheck(unsigned long, a) && \

typecheck(unsigned long, b) && \

((long)(a) - (long)(b) >= 0))

#define time_before_eq(a,b) time_after_eq(b,a)

在宏time_after中,首先確定兩個輸入參數a和b的資料類型為unsigned long,然後才執行實際的比較。

8. 結論

系統中采用jiffies來計算時間,但由于jiffies溢出可能造成時間比較的錯誤,因而強烈建議在編碼中使用 time_after等宏來比較時間先後關系,這些宏可以放心使用。

核心時鐘:

核心使用硬體提供的不同時鐘來提供依賴于時間的服務,如busy-waiting(浪費CPU周期)和sleep-waiting(放棄CPU)

5.HZ and Jiffies 

      jiffies記錄了系統啟動後的滴答數,常用的函數:time_before()、

time_after()、time_after_eq()、time_before_eq()。因為jiffies随時鐘滴答變化,不能用編譯器優化

它,應取volatile值。

      32位jiffies變量會在50天後溢出,太小,是以核心提供變量jiffies_64來hold

64位jiffies。該64位的低32位即為jiffies,在32位機上需要兩天指令來指派64位資料,不是原子的,是以核心提供函數

get_jiffies_64()。

6.Long Delays

busy-wait:timebefore(),使CPU忙等待;sleep-wait:shedule_timeout(截至時間);無論在核心空間還

是使用者空間,都沒有比HZ更精确的控制了,因為時間片都是根據滴答更新的,而且即使定義了您的程序在超過指定時間後運作,排程器也可能根據優先級選擇其他

程序執行。

    sleep-wait():wait_event_timeout()用于在滿足某個條件或逾時後重新執行,msleep()睡眠指定的ms後重新進入就緒隊列,這些長延遲僅适用于程序上下文,在中斷上下文中不能睡眠也不能長時間busy-waiting。

核心提供了timer API來在一定時間後執行某個函數:

#include <linux/timer.h>

struct timer_list my_timer;

init_timer(&my_timer);            /* Also see setup_timer() */

my_timer.expire = jiffies + n*HZ; /* n is the timeout in number                                    of seconds */

my_timer.function = timer_func;   /* Function to execute

                                     after n seconds */

my_timer.data = func_parameter;   /* Parameter to be passed                                   to timer_func */

add_timer(&my_timer);                /*Start the timer*/

如果您想周期性執行上述代碼,那麼把它們加入timer_func()函數。您使用mod_timer()來改變my_timer的逾時值,del_timer()來删掉my_timer,用timer_pending()檢視是否my_timer處于挂起狀态。

    使用者空間函數clock_settime()和clock_gettime()用于擷取核心時鐘服務。使用者應用程式使用setitimer()和getitimer()來控制alarm信号的傳遞當指定逾時發生後。

8.Real Time Clock

     RTC時鐘track絕對時間。RTC電池常超過computer生存期。可以用RTC完成以下功能:(1)讀或設定絕對時鐘,并在clock updates時産生中斷;(2)以2HZ到8192HZ來産生周期性中斷;(3)設定alarms。

    jiffies僅是相對于系統啟動的相對時間,如果想擷取absolute time或wall

time,則需要使用RTC,核心用變量xtime來記錄,當系統啟動時,讀取RTC并記錄在xtime中,當系統halt時,則将wall

time寫回RTC,函數do_gettimeofday()來讀取wall time。

#include <linux/time.h>

static struct timeval curr_time;

do_gettimeofday(&curr_time);

my_timestamp = cpu_to_le32(curr_time.tv_sec); /* Record timestamp */

    使用者空間擷取wall time的函數:time()傳回calendar time或從00:00:00 on January

1,1970的秒數;(2)localtime():傳回calendar time in broken-down

format;(3)mktime():與 localtime()相反;(4)gettimeofday()以microsecond

精确度傳回calendar時間。

    另外一個擷取RTC的方法是通過字元裝置/dev/rtc,一個時刻僅允許一個處理器通路它。

9. 時鐘和定時器

時鐘和定時器對Linux核心來說十分重要。首先,核心要管理系統的運作時間(uptime)和目前牆上時間(wall time), 即目前實際時間。其次,核心中大量的活動由時間驅動。

9.1實時時鐘

    核心必須借助硬體來實作時間管理。實時時鐘是用來持久存放系統時間的裝置,它通過主機闆電池供電,是以即便在關閉計算機系統之後,實時時鐘仍然能繼續工作。

    系統啟動時,核心讀取實時時鐘,将所讀的時間存放在變量xtime中作為牆上時間(wall

time),xtime儲存着從1970年1月1日0:00到目前時刻所經曆的秒數。雖然在Intel

x86機器上,核心會周期性地将目前時間存回實時時鐘中,但應該明确,實時時鐘的主要作用就是在啟動時初始化牆上時間xtime。

9.2系統定時器與動态定時器

周期性發生的事件都是由系統定時器驅動。在X86體系結構上,系統定時器通常是一種可程式設計硬體晶片,其産生的中斷就是時鐘中斷。時鐘中斷對應的處理程式負

責更新系統時間和執行周期性運作的任務。系統定時器的頻率稱為節拍率(tick rate),在核心中表示為HZ。

    以X86為例,在2.4之前的核心中其大小為100; 從核心2.6開始,HZ = 1000,

也就是說每秒時鐘中斷發生1000次。這一變化使得系統定時器的精度(resolution)由10ms提高到1ms,這大大提高了系統對于時間驅動事件

排程的精确性。過于頻繁的時鐘中斷不可避免地增加了系統開銷。

    與系統定時器相對的是動态定時器,它是排程事件(執行排程程式)在未來某個時刻發生的時機。核心可以動态地建立或銷毀動态定時器。

    系統定時器及其中斷處理程式是核心管理機制的中樞,下面是一些利用系統定時器周期執行的工作(中斷處理程式所做的工作):

    (1) 更新系統運作時間(uptime)

    (2) 更新目前牆上時間(wall time)

    (3) 在對稱多處理器系統(SMP)上,均衡排程各處理器上的運作隊列

    (4) 檢查目前程序是否用完了時間片(time slice),如果用盡,則進行重新排程

    (5) 運作逾時的動态定時器

    (6) 更新資源耗盡和處理器時間的統計值

    核心動态定時器依賴于系統時鐘中斷,因為隻有在系統時鐘中斷發生後核心才會去檢查目前是否有逾時的動态定時器。

---------------------------------------------------------

    X86體系結構中,核心2.6.X的HZ = 1000,

即系統時鐘中斷執行粒度為1ms,這意味着系統中周期事情最快為1ms執行一次,而不可能有更高的精度。動态定時器随時都可能逾時,但由于隻有在系統時鐘

中斷到來時核心才會檢查執行逾時的動态定時器,是以動态定時器的平均誤差大約為半個系統時鐘周期(即0.5ms).