Linux&nbsp;pipe(管道)

1、管道概述及相關API應用

1.1 管道相關的關鍵概念

管道是Linux 支援的最初Unix IPC形式之一，具有以下特點：

管道是半雙工的，資料隻能向一個方向流動；需要雙方通信時，需要建立起兩個管道；
隻能用于父子程序或者兄弟程序之間（具有親緣關系的程序）；
單獨構成一種獨立的檔案系統：管道對于管道兩端的程序而言，就是一個檔案，但它不是普通的檔案，它不屬于某種檔案系統，而是自立門戶，單獨構成一種檔案系統，并且隻存在與記憶體中。
資料的讀出和寫入：一個程序向管道中寫的内容被管道另一端的程序讀出。寫入的内容每次都添加在管道緩沖區的末尾，并且每次都是從緩沖區的頭部讀出資料。
管道分為無名管道和有名管道，其中無名管道不屬于任何檔案系統，隻存在于記憶體中，它是無名無形的，但是可以把它看作一種特殊的檔案，通過使用普通檔案的read(),write()函數對管道進行操作，

有名管道是有名有形的，為了使用這種管道，LINUX中設立了一個專門的特殊檔案系統--管道檔案，它存在于檔案系統中，任何程序可以在任何時候通過有名管道的路徑和檔案名來通路管道。但是在磁盤上的隻是一個節點，而檔案的資料則隻存在于記憶體緩沖頁面中，與普通管道一樣。
pipe是Linux中最經典的程序間通信手段，在終端裡通常用來組合指令，例如“ls -l｜wc -l”。它的作用很直覺，就是使得前一個程序的輸出作為後一個程序的輸入，在概念上很符合“管道”的意思。

1.2管道的建立：

#include

int pipe(int fd[2])

該函數建立的管道的兩端處于一個程序中間，在實際應用中沒有太大意義，是以，一個程序在由pipe()建立管道後，一般再fork一個子程序，然後通過管道實作父子程序間的通信（是以也不難推出，隻要兩個程序中存在親緣關系，這裡的親緣關系指的是具有共同的祖先，都可以采用管道方式來進行通信）。

1.3管道的讀寫規則：

管道兩端可分别用描述字fd[0]以及fd[1]來描述，需要注意的是，管道的兩端是固定了任務的。即一端隻能用于讀，由描述字fd[0]表示，稱其為管道讀端；另一端則隻能用于寫，由描述字fd[1]來表示，稱其為管道寫端。如果試圖從管道寫端讀取資料，或者向管道讀端寫入資料都将導緻錯誤發生。一般檔案的I/O函數都可以用于管道，如close、read、write等等。

從管道中讀取資料：

如果管道的寫端不存在，則認為已經讀到了資料的末尾，讀函數傳回的讀出位元組數為0；
當管道的寫端存在時，如果請求的位元組數目大于PIPE_BUF，則傳回管道中現有的資料位元組數，如果請求的位元組數目不大于PIPE_BUF，則傳回管道中現有資料位元組數（此時，管道中資料量小于請求的資料量）；或者傳回請求的位元組數（此時，管道中資料量不小于請求的資料量）。注：（PIPE_BUF在include/linux/limits.h中定義，不同的核心版本可能會有所不同。Posix.1要求PIPE_BUF至少為512位元組，red hat 7.2中為4096）。

關于管道的讀規則驗證：

#include

#include

#include

main()

int pipe_fd[2];

pid_t pid;

char r_buf[100];

char w_buf[4];

char* p_wbuf;

int r_num;

int cmd;

memset(r_buf,0,sizeof(r_buf));

memset(w_buf,0,sizeof(r_buf));

p_wbuf=w_buf;

if(pipe(pipe_fd)<0)

printf("pipe create error ");

return -1;

if((pid=fork())==0)

printf(" ");

close(pipe_fd[1]);

sleep(3);//確定父程序關閉寫端

r_num=read(pipe_fd[0],r_buf,100);

printf( "read num is %d the data read from the pipe is %d ",r_num,atoi(r_buf));

close(pipe_fd[0]);

exit();

else if(pid>0)

close(pipe_fd[0]);//read

strcpy(w_buf,"111");

if(write(pipe_fd[1],w_buf,4)!=-1)

printf("parent write over ");

close(pipe_fd[1]);//write

printf("parent close fd[1] over ");

sleep(10);

向管道中寫入資料：

向管道中寫入資料時，linux将不保證寫入的原子性，管道緩沖區一有空閑區域，寫程序就會試圖向管道寫入資料。如果讀程序不讀走管道緩沖區中的資料，那麼寫操作将一直阻塞。

注：隻有在管道的讀端存在時，向管道中寫入資料才有意義。否則，向管道中寫入資料的程序将收到核心傳來的SIFPIPE信号，應用程式可以處理該信号，也可以忽略（預設動作則是應用程式終止）。

對管道的寫規則的驗證1：寫端對讀端存在的依賴性

#include

#include

main()

int pipe_fd[2];

pid_t pid;

char r_buf[4];

char* w_buf;

int writenum;

int cmd;

memset(r_buf,0,sizeof(r_buf));

if(pipe(pipe_fd)<0)

printf("pipe create error ");

return -1;

if((pid=fork())==0)

close(pipe_fd[0]);

close(pipe_fd[1]);

sleep(10);

exit();

else if(pid>0)

sleep(1); //等待子程序完成關閉讀端的操作

close(pipe_fd[0]);//write

w_buf="111";

if((writenum=write(pipe_fd[1],w_buf,4))==-1)

printf("write to pipe error ");

else

printf("the bytes write to pipe is %d ", writenum);

close(pipe_fd[1]);

則輸出結果為： Broken pipe,原因就是該管道以及它的所有fork()産物的讀端都已經被關閉。如果在父程序中保留讀端，即在寫完pipe後，再關閉父程序的讀端，也會正常寫入pipe，讀者可自己驗證一下該結論。是以，在向管道寫入資料時，至少應該存在某一個程序，其中管道讀端沒有被關閉，否則就會出現上述錯誤（管道斷裂,程序收到了SIGPIPE信号，預設動作是程序終止）

對管道的寫規則的驗證2：linux不保證寫管道的原子性驗證

#include

#include

#include

main(int argc,char**argv)

int pipe_fd[2];

pid_t pid;

char r_buf[4096];

char w_buf[4096*2];

int writenum;

int rnum;

memset(r_buf,0,sizeof(r_buf));

if(pipe(pipe_fd)<0)

printf("pipe create error ");

return -1;

if((pid=fork())==0)

close(pipe_fd[1]);

while(1)

sleep(1);

rnum=read(pipe_fd[0],r_buf,1000);

printf("child: readnum is %d ",rnum);

close(pipe_fd[0]);

exit();

else if(pid>0)

close(pipe_fd[0]);//write

memset(r_buf,0,sizeof(r_buf));

if((writenum=write(pipe_fd[1],w_buf,1024))==-1)

printf("write to pipe error ");

else

printf("the bytes write to pipe is %d ", writenum);

writenum=write(pipe_fd[1],w_buf,4096);

close(pipe_fd[1]);

輸出結果：

the bytes write to pipe 1000

the bytes write to pipe 1000 //注意，此行輸出說明了寫入的非原子性

the bytes write to pipe 1000

the bytes write to pipe 1000

the bytes write to pipe 1000

the bytes write to pipe 120 //注意，此行輸出說明了寫入的非原子性

the bytes write to pipe 0

the bytes write to pipe 0

......

結論：

寫入數目小于4096時寫入是非原子的！

如果把父程序中的兩次寫入位元組數都改為5000，則很容易得出下面結論：

寫入管道的資料量大于4096位元組時，緩沖區的空閑空間将被寫入資料（補齊），直到寫完所有資料為止，如果沒有程序讀資料，則一直阻塞。

1.4管道應用執行個體：

執行個體一：用于shell

管道可用于輸入輸出重定向，它将一個指令的輸出直接定向到另一個指令的輸入。比如，當在某個shell程式（Bourne shell或C shell等）鍵入who│wc -l後，相應shell程式将建立who以及wc兩個程序和這兩個程序間的管道。考慮下面的指令行：

$kill -l 運作結果見附一。

$kill -l | grep SIGRTMIN 運作結果如下：

30) SIGPWR 31) SIGSYS 32) SIGRTMIN 33) SIGRTMIN+1

34) SIGRTMIN+2 35) SIGRTMIN+3 36) SIGRTMIN+4 37) SIGRTMIN+5

38) SIGRTMIN+6 39) SIGRTMIN+7 40) SIGRTMIN+8 41) SIGRTMIN+9

42) SIGRTMIN+10 43) SIGRTMIN+11 44) SIGRTMIN+12 45) SIGRTMIN+13

46) SIGRTMIN+14 47) SIGRTMIN+15 48) SIGRTMAX-15 49) SIGRTMAX-14

執行個體二：用于具有親緣關系的程序間通信

下面例子給出了管道的具體應用，父程序通過管道發送一些指令給子程序，子程序解析指令，并根據指令作相應處理。

#include

#include

main()

int pipe_fd[2];

pid_t pid;

char r_buf[4];

char** w_buf[256];

int childexit=0;

int i;

int cmd;

memset(r_buf,0,sizeof(r_buf));

if(pipe(pipe_fd)<0)

printf("pipe create error ");

return -1;

if((pid=fork())==0)

//子程序：解析從管道中擷取的指令，并作相應的處理

printf(" ");

close(pipe_fd[1]);

sleep(2);

while(!childexit)

read(pipe_fd[0],r_buf,4);

cmd=atoi(r_buf);

if(cmd==0)

printf("child: receive command from parent over now child process exit ");

childexit=1;

else if(handle_cmd(cmd)!=0)

return;

sleep(1);

close(pipe_fd[0]);

exit();

else if(pid>0)

//parent: send commands to child

close(pipe_fd[0]);

w_buf[0]="003";

w_buf[1]="005";

w_buf[2]="777";

w_buf[3]="000";

for(i=0;i<4;i++)

write(pipe_fd[1],w_buf[i],4);

close(pipe_fd[1]);

//下面是子程序的指令處理函數（特定于應用）：

int handle_cmd(int cmd)

if((cmd<0)||(cmd>256))

//suppose child only support 256 commands

printf("child: invalid command ");

return -1;

printf("child: the cmd from parent is %d ", cmd);

return 0;

1.5管道的局限性

管道的主要局限性正展現在它的特點上：

隻支援單向資料流；
隻能用于具有親緣關系的程序之間；
沒有名字；
管道的緩沖區是有限的（管道制存在于記憶體中，在管道建立時，為緩沖區配置設定一個頁面大小）；

管道所傳送的是無格式位元組流，這就要求管道的讀出方和寫入方必須事先約定好資料的格式，比如多少位元組算作一個消息（或指令、或記錄）等等；

Linux管道的實作機制

在Linux中，管道是一種使用非常頻繁的通信機制。從本質上說，管道也是一種檔案，但它又和一般的檔案有所不同，管道可以克服使用檔案進行通信的兩個問題，具體表現為：

限制管道的大小。實際上，管道是一個固定大小的緩沖區。在Linux中，該緩沖區的大小為1頁，即4K位元組，使得它的大小不象檔案那樣不加檢驗地增長。使用單個固定緩沖區也會帶來問題，比如在寫管道時可能變滿，當這種情況發生時，随後對管道的write()調用将預設地被阻塞，等待某些資料被讀取，以便騰出足夠的空間供write()調用寫。

讀取程序也可能工作得比寫程序快。當所有目前程序資料已被讀取時，管道變空。當這種情況發生時，一個随後的read()調用将預設地被阻塞，等待某些資料被寫入，這解決了read()調用傳回檔案結束的問題。

注意：從管道讀資料是一次性操作，資料一旦被讀，它就從管道中被抛棄，釋放空間以便寫更多的資料。

1. 管道的結構

在 Linux 中，管道的實作并沒有使用專門的資料結構，而是借助了檔案系統的file結構和VFS的索引節點inode。通過将兩個 file 結構指向同一個臨時的 VFS 索引節點，而這個 VFS 索引節點又指向一個實體頁面而實作的。如圖 7.1所示。

圖7.1 管道結構示意圖

Linux&nbsp;pipe(管道)

圖7.1中有兩個 file 資料結構，但它們定義檔案操作例程位址是不同的，其中一個是向管道中寫入資料的例程位址，而另一個是從管道中讀出資料的例程位址。這樣，使用者程式的系統調用仍然是通常的檔案操作，而核心卻利用這種抽象機制實作了管道這一特殊操作。

2.管道的讀寫

管道實作的源代碼在fs/pipe.c中，在pipe.c中有很多函數，其中有兩個函數比較重要，即管道讀函數pipe_read()和管道寫函數pipe_wrtie()。管道寫函數通過将位元組複制到 VFS 索引節點指向的實體記憶體而寫入資料，而管道讀函數則通過複制實體記憶體中的位元組而讀出資料。當然，核心必須利用一定的機制同步對管道的通路，為此，核心使用了鎖、等待隊列和信号。

當寫程序向管道中寫入時，它利用标準的庫函數write()，系統根據庫函數傳遞的檔案描述符，可找到該檔案的 file 結構。file 結構中指定了用來進行寫操作的函數（即寫入函數）位址，于是，核心調用該函數完成寫操作。寫入函數在向記憶體中寫入資料之前，必須首先檢查 VFS 索引節點中的資訊，同時滿足如下條件時，才能進行實際的記憶體複制工作：

記憶體中有足夠的空間可容納所有要寫入的資料；

記憶體沒有被讀程式鎖定。

如果同時滿足上述條件，寫入函數首先鎖定記憶體，然後從寫程序的位址空間中複制資料到記憶體。否則，寫入程序就休眠在 VFS 索引節點的等待隊列中，接下來，核心将調用排程程式，而排程程式會選擇其他程序運作。寫入程序實際處于可中斷的等待狀态，當記憶體中有足夠的空間可以容納寫入資料，或記憶體被解鎖時，讀取程序會喚醒寫入程序，這時，寫入程序将接收到信号。當資料寫入記憶體之後，記憶體被解鎖，而所有休眠在索引節點的讀取程序會被喚醒。

管道的讀取過程和寫入過程類似。但是，程序可以在沒有資料或記憶體被鎖定時立即傳回錯誤資訊，而不是阻塞該程序，這依賴于檔案或管道的打開模式。反之，程序可以休眠在索引節點的等待隊列中等待寫入程序寫入資料。當所有的程序完成了管道操作之後，管道的索引節點被丢棄，而共享資料頁也被釋放。

因為管道的實作涉及很多檔案的操作,是以,當讀者學完有關檔案系統的内容後來讀pipe.c中的代碼，你會覺得并不難了解

(轉自Internet)

Linux&nbsp;pipe(管道)

繼續閱讀

Apache (You don't have permission to access / on this server.）

debian9更新4.9.0核心到4.19.2核心過程

centOS7 配置 vsftpd 虛拟使用者及權限Vsftpd配置虛拟使用者及權限

linux-svn解除安裝與安裝

vsftp虛拟多使用者多權限一鍵部署腳本

Ubuntu14.04 LTS下安裝mongodb

httpd服務的部署、啟動、配置和簡單優化一、部署二、啟動三、配置檔案

配置網頁内容通路

手動安裝Intel network I217-LM網卡的Linux驅動

禁止ubuntu系統彈出報錯界面

Ubuntu Linux下Apache的配置檔案

samba伺服器的功能

【Linux】UDP廣播封包接收速率問題

Linux裝置模型（中）之上層容器

PowerPC平台 Linux移植三

Linux&amp;nbsp;pipe(管道)

繼續閱讀

Linux pipe(管道)