fork知识入门
python的os module中有fork()函数用于生成子进程,生成的子进程是父进程的镜像,但是它们有各自的地址空间,子进程复制一份父进程内存给自己,两个进程之间的执行是相互独立的,其执行顺序可以是不确定的、随机的、不可预测的,这点与多线程的执行顺序相似。
import os
import time
try:
forkpid = os.fork()
time.sleep()
print type(forkpid)
except OSError:
sys.exit('Unable to fork.')
输出如下
wayne@Z-Beatles:~/python$ python demo
<type 'int'>
<type 'int'>
3秒后可见fork的返回值是两个int型数值
python运行时创建进程
当python脚本运行,系统会生成一个新的进程。先看下面代码:
from time import sleep
sleep()
因为代码执行完后,进程就会被销毁,所以这里睡眠30秒,方便看到效果。再执行这个脚本文件:
python testfork.py &
加上&符号,可以让程序在后台运行,不会占用终端。输入ps -l命令查看进程,在电脑上输出如下:
F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD
S - wait pts/ :: bash
S - poll_s pts/ :: python
R - - pts/ :: ps
其中第二条记录就是刚才运行的python脚本了。
使用fork来创建一个新进程
使用fork创建一个新进程成功后,新进程会是原进程的子进程,原进程称为父进程。如果发生错误,则会抛出OSError异常。
from time import sleep
import os
try:
pid = os.fork()
except OSError, e:
pass
sleep()
运行代码后查看进程,输出如下:
F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD
S - wait pts/ :: bash
S - poll_s pts/ :: python
S - poll_s pts/ :: python
R - - pts/ :: ps
可以看出第二条python进程就是第一条的子进程。
fork进程后的程序流程
使用fork创建子进程后,子进程会复制父进程的数据信息,而后程序就分两个进程继续运行后面的程序,这也是fork(分叉)名字的含义了。在子进程内,这个方法会返回0;在父进程内,这个方法会返回子进程的编号PID。可以使用PID来区分两个进程:
import os
from time import sleep
source =
try:
pid = os.fork()
if pid == : #子进程
source = source -
sleep()
print "this is child process.source is %d" %source
else:
print "this is parent process.source is %d" %source
except OSError, e:
pass
上面代码中,在子进程创建前,声明了一个变量source,然后在子进程中自减1,最后打印出source的值,显然父进程打印出来的值应该为10,4秒后子进程打印出来的值应该为9。
守护进程
既然子进程是父进程创建的,那么父进程退出之后,子进程会怎么样呢?此时,子进程会被PID为1的进程接管,就是init进程了。这样子进程就不会受终端退出影响了,使用这个特性就可以创建在后台执行的程序,俗称守护进程(daemon)。
mark-守护进程
- linux python守护进程编写
- Python实例浅谈之五Python守护进程和脚本单例运行
- Linux守护进程设计规范及python实现
Tips
- fork()函数用来创建新的进程
- os.fork() 会有两次返回值,分别是父进程和子进程的返回值
- 在父进程中,fork返回的值是子进程的PID;
- 子进程中,这个返回值为0
- 子进程会复制父进程的上下文
- 父子进程并不能确定执行顺序
- os.getpid()返回当前进程的ID,os.getppid()返回当前进程的父进程的ID
- os.fork() 之后,子进程一定要使用 exit() 或者 os._exit() 来退出子进程环境,建议使用 os._exit()
- 可以使用os.waitpid(pid,0)来使父进程等待子进程执行完再执行父进程
waitpid()的使用
import os
import sys
import time
try :
forkPID1 = os.fork()
except OSError : # 如果操作系统不能创建进程,osfork()将会发出一个OSError异常
sys.exit('Unable to create first child.')
if forkPID1 != :
try :
forkPID2 = os.fork()
except OSError :
sys.exit('Unable to create first child.')
if forkPID2 > :
print 'Parent waiting for child precesses ...\n' + \
'\t tpid : %d , forkPID1 : %d , forkPID2 : %d' \
% ( os.getpid() , forkPID1 , forkPID2)
try :
child2 = os.waitpid (forkPID2 , )[]
except OSError :
sys.exit("No child process with pid %d." %(forkPID2) )
print 'Parent Child %d finished.' % child2
elif forkPID2 == :
print 'Chile2 sleeping fot 4 seconds ....\n' + \
'\tpid : %d , forkPID1: %d , forkPID2: %d' \
% (os.getpid() , forkPID1 , forkPID2 )
time.sleep() #规定进程保持的休眠时间 , 以秒为单位
elif forkPID1 == :
print 'Child1 sleeping for 2 seconds ....\n' + \
'\tpid : %d , forkPID1: %d' \
% (os.getpid() , forkPID1)
time.sleep()
- 这里的’\’为‘反斜杠’or‘续航符’
严格地讲, 在小括号, 方括号或大括号中的表达式 (如 定义一个 dictionary) 可以用或者不用续行符 (“\”) 分割成多行。甚至在不是必需的时候,也可以使用续行符,那可以让代码读起来更容易。使用续行符只是风格的问题。
3个示范输出
Parent waiting for child precesses ...
tpid : , forkPID1 : , forkPID2 :
Child1 sleeping for seconds ....
pid : , forkPID1:
Chile2 sleeping fot seconds ....
pid : , forkPID1: , forkPID2:
Parent Child finished.
Parent waiting for child precesses ...
tpid : , forkPID1 : , forkPID2 :
Child1 sleeping for seconds ....
Chile2 sleeping fot seconds ....
pid : , forkPID1:
pid : , forkPID1: , forkPID2:
Parent Child finished.
Parent waiting for child precesses ...
tpid : , forkPID1 : , forkPID2 :
Child1 sleeping for seconds ....
pid : , forkPID1:
Chile2 sleeping fot seconds ....
pid : , forkPID1: , forkPID2:
Parent Child finished.