天天看點

linux的poll機制linux的poll機制

linux的poll機制

Poll就是監控檔案是否可讀的一種機制,作用與select一樣。

應用程式的調用函數如下:

int poll(struct pollfd *fds,nfds_t nfds, int timeout);

Poll機制會判斷fds中的檔案是否可讀,如果可讀則會立即傳回,傳回的值就是可讀fd的數量,如果不可讀,那麼就程序就會休眠timeout這麼長的時間,然後再來判斷是否有檔案可讀,如果有,傳回fd的數量,如果沒有,則傳回0. 

核心實作流程:

當應用程式調用poll函數的時候,會調用到系統調用sys_poll函數,該函數最終調用do_poll函數,do_poll函數中有一個死循 環,

在裡面又會利用do_pollfd函數去調用驅動中的poll函數(fds中每個成員的字元驅動程式都會被掃描到),驅動程式中的Poll函數的工作 有兩個,

一個就是調用poll_wait 函數,把程序挂到等待隊列中去(這個是必須的,你要睡眠,必須要在一個等待隊列上面,否則到哪裡去喚醒你呢??),

另一個是确定相關的fd是否有内容可 讀,如果可讀,就傳回1,否則傳回0,如果傳回1 ,do_poll函數中的count++,    

然後  do_poll函數然後判斷三個條件(if (count ||!timeout || signal_pending(current)))如果成立就直接跳出,如果不成立,

就睡眠timeout個jiffes這麼長的時間(調用schedule_timeout實作睡眠),如果在這段時間内沒有其他程序去喚醒它,

那麼第二次執行判斷的時候就會跳出死循環。如果在這段時間内有其他程序喚醒它,那麼也可以跳出死循環傳回

(例如我們可以利用中斷處理函數去喚醒它,這樣的話一有資料可讀,就可以讓它立即傳回)。

1.      sys_poll函數位于fs/select.c檔案中,代碼如下:

asmlinkagelong sys_poll(struct pollfd __user *ufds, unsigned int nfds, long timeout_msecs)

{        

 s64 timeout_jiffies;

         if (timeout_msecs > 0) {

#ifHZ > 1000

             if (timeout_msecs / 1000 >(s64)0x7fffffffffffffffULL / (s64)HZ)

                 timeout_jiffies = -1;

             else

#endif

                 timeout_jiffies =msecs_to_jiffies(timeout_msecs);

         } 

else

 {

             timeout_jiffies = timeout_msecs;

         } 

         return do_sys_poll(ufds,nfds, &timeout_jiffies);

}

它對逾時參數稍作處理後,直接調用do_sys_poll。 

2.      do_sys_poll函數也位于位于fs/select.c檔案中,我們忽略其他代碼:

intdo_sys_poll(struct pollfd __user *ufds, unsigned int nfds, s64 *timeout)

{

……

poll_initwait(&table);

……

         fdcount = do_poll(nfds, head,&table, timeout);

……

poll_initwait函數非常簡單,它初始化一個poll_wqueues變量table:

poll_initwait> init_poll_funcptr(&pwq->pt, __pollwait); > pt->qproc = qproc;

即table->pt->qproc= __pollwait,__pollwait将在驅動的poll函數裡用到。 

3.      do_sys_poll函數位于fs/select.c檔案中,代碼如下:

static int do_poll(unsigned int nfds,  struct poll_list *list,   struct poll_wqueues *wait, s64 *timeout)

{

01 ……

02   for (;;){

03 ……

04                   if(do_pollfd(pfd, pt)) {

05                           count++;

06                           pt = NULL;

07                   }

08 ……

09       if(count || !*timeout || signal_pending(current))

10           break;

11       count= wait->error;

12       if(count)

13           break;14

15       if(*timeout < 0) {

16          

17           __timeout= MAX_SCHEDULE_TIMEOUT;

18       }else if (unlikely(*timeout >= (s64)MAX_SCHEDULE_TIMEOUT-1)) {

19          

23           __timeout= MAX_SCHEDULE_TIMEOUT - 1;

24           *timeout-= __timeout;

25       }else {

26           __timeout= *timeout;

27           *timeout= 0;

28       }29

30       __timeout= schedule_timeout(__timeout); // 休眠時間由應用提供

31       if(*timeout >= 0)

32           *timeout+= __timeout;

33   }

34   __set_current_state(TASK_RUNNING);

35   returncount;

36 } 

分析其中的代碼,可以發現,它的作用如下:

①    從02行可以知道,這是個循環,它退出的條件為:

a.      09行的3個條件之一(count非0,逾時、有信号等待處理)

count順0表示04行的do_pollfd至少有一個成功。

b.      11、12行:發生錯誤

②    重點在do_pollfd函數,後面再分析

③    第30行,讓本程序休眠一段時間,注意:應用程式執行poll調用後,如果①②的條件不滿足,程序就會進入休眠。那麼,誰喚醒呢?除了休眠到指定時間被系統喚醒外,還可以被驅動程式喚醒──記住這點,這就是為什麼驅動的poll裡要調用poll_wait的原因,後面分析。 

4.      do_pollfd函數位于fs/select.c檔案中,代碼如下:

static inline unsigned int do_pollfd(struct pollfd*pollfd, poll_table *pwait)

{

……

             if(file->f_op && file->f_op->poll)

                     mask= file->f_op->poll(file, pwait);

……

可見,它就是調用我們的驅動程式裡注冊的poll函數。 

二、驅動程式:

驅動程式裡與poll相關的地方有兩處:一是構造file_operation結構時,要定義自己的poll函數。二是通過poll_wait來調用上面說到的__pollwait函數,pollwait的代碼如下:

staticinline void poll_wait(struct file * filp, wait_queue_head_t * wait_address,poll_table *p)

{

         if (p && wait_address)

             p->qproc(filp, wait_address, p);

}

p->qproc就是__pollwait函數,從它的代碼可知,它隻是把目前程序挂入我們驅動程式裡定義的一個隊列裡而已。它的代碼如下:

staticvoid __pollwait(struct file *filp, wait_queue_head_t *wait_address,  poll_table *p)

{

         struct poll_table_entry *entry =poll_get_entry(p);

         if (!entry)

             return;

         get_file(filp);

         entry->filp = filp;

         entry->wait_address = wait_address;

         init_waitqueue_entry(&entry->wait,current);

         add_wait_queue(wait_address,&entry->wait);

執行到驅動程式的poll_wait函數時,程序并沒有休眠,我們的驅動程式裡實作的poll函數是不會引起休眠的。讓程序進入休眠,是前面分析的do_sys_poll函數的30行“__timeout = schedule_timeout(__timeout)”。

poll_wait隻是把本程序挂入某個隊列,應用程式調用poll > sys_poll> do_sys_poll > poll_initwait,do_poll > do_pollfd > 我們自己寫的poll函數後,再調用schedule_timeout進入休眠。如果我們的驅動程式發現情況就緒,可以把這個隊列上挂着的程序喚醒。可見,poll_wait的作用,隻是為了讓驅動程式能找到要喚醒的程序。即使不用poll_wait,我們的程式也有機會被喚醒:chedule_timeout(__timeout),隻是休眠__time_out這段時間。

現在來總結一下poll機制:

1. poll > sys_poll > do_sys_poll >poll_initwait,poll_initwait函數注冊一下回調函數__pollwait,它就是我們的驅動程式執行poll_wait時,真正被調用的函數。 

2. 接下來執行file->f_op->poll,即我們驅動程式裡自己實作的poll函數

   它會調用poll_wait把自己挂入某個隊列,這個隊列也是我們的驅動自己定義的;

   它還判斷一下裝置是否就緒。 

3. 如果裝置未就緒,do_sys_poll裡會讓程序休眠一定時間,這個時間是應用提供的“逾時時間” 

4. 程序被喚醒的條件有2:一是上面說的“一定時間”到了,二是被驅動程式喚醒。驅動程式發現條件就緒時,就把“某個隊列”上挂着的程序喚醒,這個隊列,就是前面通過poll_wait把本程序挂過去的隊列。 

5. 如果驅動程式沒有去喚醒程序,那麼chedule_timeout(__timeou)逾時後,會重複2、3動作1次,直到應用程式給定的時間, 然後傳回。

驅動的poll函數編寫模闆如下:

static DECLARE_WAIT_QUEUE_HEAD(my_waitq);  //休眠要挂的等待隊列

static unsigned drv_poll(struct file *file, poll_table *wait)

{

unsigned int mask = 0;

poll_wait(file, &my_waitq, wait); // 不會立即休眠

if (有資料)

mask |= POLLIN | POLLRDNORM;

return mask;

}

轉自http://blog.csdn.net/yangsong512/article/details/12402345

繼續閱讀