这是一本很薄的书,能够让你对Linux 有个较深入的了解。
- 通过系统调Unix 进程用实现文件读写、网络数据收发、分配内存等。
- Unix 下所有代码都是在进程中运行的。
- 系统中所有进程都有一个唯一的进程标示符,pid。系统调用:
getpid
- 每个进程都有对应的父进程。系统调用:
getppid
- 进程打开一个资源,会获得文件描述符,该文件描述符只存在进程内部,进程关闭时一同关闭。系统调用:
open close read write pipe fsync stat
- 文件描述符用来跟踪打开资源,每次都会被分配最小的尚未使用的数值(从3 开始)。一旦资源关闭,数字可以重新被使用,也意味着内核不对该资源进行跟踪。
- 每个进程都有三个打开的资源,STDIN 标准输入,STDOUT 标准输出,STDERR 标准错误,文件描述符分别是0,1,2
- 进程拥有可以打开的文件描述符数量,软限制和硬限制。
- 进程的其他限制:当前用户允许的最大并发进程数量,可创建的最大文件,进程栈最大段的大小。系统调用:
getrlimit setrlimit
- 每个进程都有环境变量(包含进程数据的键值对),子进程继承父进程的环境变量。系统调用
setenv getenv environ
- 所有进程都有参数,ARGV,系统调用:
optparse
- 每个进程都有退出码(0-255),0 一般表示顺利退出。
- 进程可以fork 子进程,子进程继承了父进程所占用内存的所有内容,以及所有属于父进程的打开的文件描述符,可以共享打开的文件、套接字。
- 子进程是一个全新的进程,因此也有自己的pid。而该进程的父进程(也就是调用fork 的进程)的pid,在子进程中用ppid 可以得到。
- fork 函数,一次调用两个返回,一个是在父进程中,一个是在子进程中。系统调用:
fork
。 - 父进程结束后,子进程不会同归于尽,而是形成孤儿进程。
-
Cow copy-on-write
,创建子进程的时候,不是直接复制完全一样的一份,而是在需要的时候复制,能减少系统的开销。 - 有一种应用场合是,父进程fork 出一个子进程做某件事情,而自己还专注于自己当前的事情。
- 关注子进程,也叫看顾进程,master/worker 或者preforking(What exactly is a pre-fork web server model?,在请求到来之前就fork 好,比如gunicorn,往往用到线程不安全的场合,因为一个子进程挂掉不会影响其他的) 。这种模式就是指主进程fork 出多个并发子进程,确保这些子进程保持相应,并对子进程的退出做出回应。系统调用:
waitpid
- 任何已经结束的进程,如果它的状态一直未能被读取,那么,它就是一个僵尸进程。
- 父进程可以通过
waitpid
来等待子进程结束。但是这是一个阻塞调用,不是所以肚饿父进程都有闲暇一直来照顾子进程,所以,可以使用Unix 信号。信号是一种异步通信,当进程从内核收到一个信号,可以:1. 忽略该信号,2. 执行特定操作,3. 执行默认操作。 - 信号,由一个进程发出到另一个进程,用内核做中介。信号的默认操作有:
Term 进程会结束
Core 进程结束并进行核心转储(栈跟踪)
Ign 进程会忽略该信号
Stop 进程会暂停
Cont 进程会继续运行
。信号有:SIGHUP SIGINT SIGQUIT SIGILL SIGABRT SIGFPE SIGKILL SIGSEGV SIGPIPE SIGALRM SIGTERM SIGUSR1 SIGUSR2 SIGCHLD SIGONT SIGSTOP SIGTSTP SIGTTIN SIGTTOU
。系统调用kill sigaction signal
- 进程间通信(IPC)常用管道(单向的)和socket(双向的)。系统调用:
pipe socketpair recv send
. - 守护进程在后台运行的进程,不受终端用户控制。Web 服务器就是守护进程。init 进程是内核被引导时候产生的进程,pid=1,ppid=0 是所有进程的父进程。系统调用:
setsid getpgrp