天天看点

进程间通信(IPC)介绍(转)

进程间通信(IPC,InterProcess Communication)是指在不同进程之间传播或交换信息。

IPC的方式通常有管道(包括无名管道和命名管道)、消息队列、信号量、共享存储、Socket、Streams等。其中 Socket和Streams支持不同主机上的两个进程IPC。

以Linux中的C语言编程为例。

管道,通常指无名管道,是 UNIX 系统IPC最古老的形式。

它是半双工的(即数据只能在一个方向上流动),具有固定的读端和写端。

它只能用于具有亲缘关系的进程之间的通信(也是父子进程或者兄弟进程之间)。

它可以看成是一种特殊的文件,对于它的读写也可以使用普通的read、write 等函数。但是它不是普通的文件,并不属于其他任何文件系统,并且只存在于内存中。

当一个管道建立时,它会创建两个文件描述符:​<code>​fd[0]​</code>​为读而打开,​<code>​fd[1]​</code>​为写而打开。如下图:

进程间通信(IPC)介绍(转)

要关闭管道只需将这两个文件描述符关闭即可。

单个进程中的管道几乎没有任何用处。所以,通常调用 pipe 的进程接着调用 fork,这样就创建了父进程与子进程之间的 IPC 通道。如下图所示:

进程间通信(IPC)介绍(转)

若要数据流从父进程流向子进程,则关闭父进程的读端(​<code>​fd[0]​</code>​)与子进程的写端(​<code>​fd[1]​</code>​);反之,则可以使数据流从子进程流向父进程。

FIFO,也称为命名管道,它是一种文件类型。

FIFO可以在无关的进程之间交换数据,与无名管道不同。

FIFO有路径名与之相关联,它以一种特殊设备文件形式存在于文件系统中。

其中的 mode 参数与​<code>​open​</code>​函数中的 mode 相同。一旦创建了一个 FIFO,就可以用一般的文件I/O函数操作它。

当 open 一个FIFO时,是否设置非阻塞标志(​<code>​O_NONBLOCK​</code>​)的区别:

若没有指定<code>O_NONBLOCK</code>(默认),只读 open 要阻塞到某个其他进程为写而打开此 FIFO。类似的,只写 open 要阻塞到某个其他进程为读而打开它。

若指定了<code>O_NONBLOCK</code>,则只读 open 立即返回。而只写 open 将出错返回 -1 如果没有进程已经为读而打开该 FIFO,其errno置ENXIO。

FIFO的通信方式类似于在进程中使用文件来传输数据,只不过FIFO类型文件同时具有管道的特性。在数据读出时,FIFO管道中同时清除数据,并且“先进先出”。下面的例子演示了使用 FIFO 进行 IPC 的过程:

write_fifo.c

read_fifo.c

在两个终端里用 gcc 分别编译运行上面两个文件,可以看到输出结果如下:

上述例子可以扩展成 客户进程—服务器进程 通信的实例,​<code>​write_fifo​</code>​的作用类似于客户端,可以打开多个客户端向一个服务器发送请求信息,​<code>​read_fifo​</code>​类似于服务器,它适时监控着FIFO的读端,当有数据时,读出并进行处理,但是有一个关键的问题是,每一个客户端必须预先知道服务器提供的FIFO接口,下图显示了这种安排:

进程间通信(IPC)介绍(转)

消息队列,是消息的链接表,存放在内核中。一个消息队列由一个标识符(即队列ID)来标识。

消息队列是面向记录的,其中的消息具有特定的格式以及特定的优先级。

消息队列独立于发送与接收进程。进程终止时,消息队列及其内容并不会被删除。

消息队列可以实现消息的随机查询,消息不一定要以先进先出的次序读取,也可以按消息的类型读取。

在以下两种情况下,​<code>​msgget​</code>​将创建一个新的消息队列:

如果没有与键值key相对应的消息队列,并且flag中包含了​<code>​IPC_CREAT​</code>​标志位。

key参数为​<code>​IPC_PRIVATE​</code>​。

函数​<code>​msgrcv​</code>​在读取消息队列时,type参数有下面几种情况:

​<code>​type == 0​</code>​,返回队列中的第一个消息;

​<code>​type &gt; 0​</code>​,返回队列中消息类型为 type 的第一个消息;

​<code>​type &lt; 0​</code>​,返回队列中消息类型值小于或等于 type 绝对值的消息,如果有多个,则取类型值最小的消息。

可以看出,type值非 0 时用于以非先进先出次序读消息。也可以把 type 看做优先级的权值。(其他的参数解释,请自行Google之)

下面写了一个简单的使用消息队列进行IPC的例子,服务端程序一直在等待特定类型的消息,当收到该类型的消息以后,发送另一种特定类型的消息作为反馈,客户端读取该反馈并打印出来。

msg_server.c

msg_client.c

信号量(semaphore)与已经介绍过的 IPC 结构不同,它是一个计数器。信号量用于实现进程间的互斥与同步,而不是用于存储进程间通信数据。

信号量用于进程间同步,若要在进程间传递数据需要结合共享内存。

信号量基于操作系统的 PV 操作,程序对信号量的操作都是原子操作。

每次对信号量的 PV 操作不仅限于对信号量值加 1 或减 1,而且可以加减任意正整数。

支持信号量组。

最简单的信号量是只能取 0 和 1 的变量,这也是信号量最常见的一种形式,叫做二值信号量(Binary Semaphore)。而可以取多个正整数的信号量被称为通用信号量。

Linux 下的信号量函数都是在通用的信号量数组上进行操作,而不是在一个单一的二值信号量上进行操作。

当​<code>​semget​</code>​创建新的信号量集合时,必须指定集合中信号量的个数(即​<code>​num_sems​</code>​),通常为1; 如果是引用一个现有的集合,则将​<code>​num_sems​</code>​指定为 0 。

在​<code>​semop​</code>​函数中,​<code>​sembuf​</code>​结构的定义如下:

其中 sem_op 是一次操作中的信号量的改变量:

若<code>sem_op &gt; 0</code>,表示进程释放相应的资源数,将 sem_op 的值加到信号量的值上。如果有进程正在休眠等待此信号量,则换行它们。

若<code>sem_op &lt; 0</code>,请求 sem_op 的绝对值的资源。

如果相应的资源数可以满足请求,则将该信号量的值减去sem_op的绝对值,函数成功返回。

当相应的资源数不能满足请求时,这个操作与​<code>​sem_flg​</code>​有关。

sem_flg 指定​<code>​IPC_NOWAIT​</code>​,则semop函数出错返回​<code>​EAGAIN​</code>​。

sem_flg 没有指定​<code>​IPC_NOWAIT​</code>​,则将该信号量的semncnt值加1,然后进程挂起直到下述情况发生:

当相应的资源数可以满足请求,此信号量的semncnt值减1,该信号量的值减去sem_op的绝对值。成功返回;

此信号量被删除,函数smeop出错返回EIDRM;

进程捕捉到信号,并从信号处理函数返回,此情况下将此信号量的semncnt值减1,函数semop出错返回EINTR

若<code>sem_op == 0</code>,进程阻塞直到信号量的相应值为0:

当信号量已经为0,函数立即返回。

如果信号量的值不为0,则依据​<code>​sem_flg​</code>​决定函数动作:

sem_flg指定​<code>​IPC_NOWAIT​</code>​,则出错返回​<code>​EAGAIN​</code>​。

sem_flg没有指定​<code>​IPC_NOWAIT​</code>​,则将该信号量的semncnt值加1,然后进程挂起直到下述情况发生:

信号量值为0,将信号量的semzcnt的值减1,函数semop成功返回;

进程捕捉到信号,并从信号处理函数返回,在此情况将此信号量的semncnt值减1,函数semop出错返回EINTR

在​<code>​semctl​</code>​函数中的命令有多种,这里就说两个常用的:

​<code>​SETVAL​</code>​:用于初始化信号量为一个已知的值。所需要的值作为联合semun的val成员来传递。在信号量第一次使用之前需要设置信号量。

​<code>​IPC_RMID​</code>​:删除一个信号量集合。如果不删除信号量,它将继续在系统中存在,即使程序已经退出,它可能在你下次运行此程序时引发问题,而且信号量是一种有限的资源。

上面的例子如果不加信号量,则父进程会先执行完毕。这里加了信号量让父进程等待子进程执行完以后再执行。

共享内存(Shared Memory),指两个或多个进程共享一个给定的存储区。

共享内存是最快的一种 IPC,因为进程是直接对内存进行存取。

因为多个进程可以同时操作,所以需要进行同步。

信号量+共享内存通常结合在一起使用,信号量用来同步对共享内存的访问。

当用​<code>​shmget​</code>​函数创建一段共享内存时,必须指定其 size;而如果引用一个已存在的共享内存,则将 size 指定为0 。

当一段共享内存被创建以后,它并不能被任何进程访问。必须使用​<code>​shmat​</code>​函数连接该共享内存到当前进程的地址空间,连接成功后把共享内存区对象映射到调用进程的地址空间,随后可像本地空间一样访问。

​<code>​shmdt​</code>​函数是用来断开​<code>​shmat​</code>​建立的连接的。注意,这并不是从系统中删除该共享内存,只是当前进程不能再访问该共享内存而已。

​<code>​shmctl​</code>​函数可以对共享内存执行多种操作,根据参数 cmd 执行相应的操作。常用的是​<code>​IPC_RMID​</code>​(从系统中删除该共享内存)。

下面这个例子,使用了【共享内存+信号量+消息队列】的组合来实现服务器进程与客户进程间的通信。

共享内存用来传递数据;

信号量用来同步;

消息队列用来 在客户端修改了共享内存后 通知服务器读取。

server.c

client.c

注意:当​<code>​scanf()​</code>​输入字符或字符串时,缓冲区中遗留下了​<code>​\n​</code>​,所以每次输入操作后都需要清空标准输入的缓冲区。但是由于 gcc 编译器不支持​<code>​fflush(stdin)​</code>​(它只是标准C的扩展),所以我们使用了替代方案:

作者: ​​ZH奶酪——张贺 ​​