Linux内核之进程管理

文章由LinuxBoy分享于2019-04-01 03:04:18热评（147）

Linux内核之进程管理

引言：

在Linux的内核的五大组成模块中，进程管理模块时非常重要的一部分，它虽然不像内存管理、虚拟文件系统等模块那样复杂，也不像进程间通信模块那样条理化，但作为五大内核模块之一，进程管理对我们理解内核的运作、对于我们以后的编程非常重要。同时，作为五大组成模块中的核心模块，它与其他四个模块都有联系。下面就对进程模块进行想写的介绍，首先要了解进程及其相关的概念。其次介绍进程的创建、切换、撤销等基本操作。除此之外，还给出了Linux内核是如何对进程进行调度管理的。

Linux内核——进程管理与调度

Linux 进程管理的常用命令示例

Linux操作系统第10讲_进程管理 PPT

Linux 进程管理 [screen/ps/kill]

一、进程及其相关概念

进程：进程可以理解为程序执行的一个实例，它包括可执行程序以及与其相关的系统资源，比如打开的文件、挂起的信号、内核内部数据、处理器状态、内存地址空间及包含全局变量的数据段等。从内核的角度看，进程也可以称为任务。

进程描述符：与进程相关的事情非常多，比如进程的状态、进程的优先级、进程的地址空间、允许该进程访问的文件等等，Linux内核为此专门设计了一个类型为task_struct的结构体，称之为进程描述符。进程描述符中包含了内核管理进程的所有信息，可以说，只要得到一个进程的进程描述符，就可以知道一个进程的所有信息。

进程状态：进程描述符task_struct结构体中有一个state字段，表示进程当前的所处状态。从进程的创建到进程的删除，它可以经过5种不同的状态，分别是可运行状态、可中断的等待状态、不可中断的等待状态、暂停状态、跟踪状态。除此之外，当进程被终止时，还可能会变为僵死状态、僵死撤消状态。内核可以使用宏set_current_state(state)设置当前进程的状态，用set_task_state(task,state)设置某进程的状态。

进程标示符：进程描述task_struct结构体中的pid字段可以标识唯一标识一个进程，称之为进程标识符PID。当创建一个新进程时，PID是按照顺序从小到大分配给新进程的。内核通过管理一个pidmap_array位图来表示当前已分配的PID和闲置的PID号。注意：在多线程组中，所有的线程共享相同的PID。除了进程标识符外，内核对进程的大部分访问时通过进程描述符指针进行的。

进程关系：进程之间的关系有亲属关系和非亲属关系。亲属关系包括父子关系和兄弟关系等。其中由tast_struct结构体中的parent/children/real_parent/sibling等字段描述。除了亲属关系外，还有其他关系，比如，一个进程是一个进程组或登录会话的领头进程，可能是一个线程组的领头进程，这些关系由group_leader/tgid/signal->pgrp等字段描述。

进程资源：为了防止进程过度的使用系统资源，内核为每个进程使用资源的数量进行了一些限制。其中包括进程地址空间的最大数、进程使用CPU的最大时间、堆的最大值、文件大小的最大值、文件锁数量的最大值、消息队列的最大字节数、打开文件描述符的最大数、进程拥有的页框最大数等。

二、进程的创建、切换、撤销

进程的创建：在Linux环境编程时，一般采用fork()函数来创建新的进程，当然，那是在用户空间的函数，它会调用内核中的clone()系统调用，由clone()函数继续调用do_fork()完成进程的创建。

传统Unix系统中，创建的子进程复制父进程所拥有的资源，这种方法效率低，因为子进程需要拷贝父进程的整个地址空间。但是，子进程几乎不必读或修改父进程拥有的所有资源，因为很多情况下，子进程创建后会立即调用exec()一族的函数，并清除父进程仔细拷贝过来的地址空间。现代Unix系统用三种方式解决了这个问题：1、写实复制技术允许父子进程读相同的物理页。2、轻量级进程允许父子进程共享每进程在内核的很多数据结构。3、vfork()系统调用创建的进程能共享父进程的内存地址空间，为了防止父进程重写子进程需要的数据，阻塞父进程的执行，一直到子进程退出或执行一个新的程序为止。整个进程创建过程可能涉及到如下函数：

fork()/vfork()/_clone----------->clone()--------->do_fork()---------->copy_process()

上面的创建过程结束之后，就有了处于可运行状态的完整的子进程，新的子进程有了PID、进程描述符等各种数据结构，要想实际运行它，还需要调度程序把CPU交给新创建的子进程。

除了进程外，还有内核线程(用kernet_thread创建)的概念。在Linux中，内核线程与普通进程存在以下两个方面的不同：

1、内核线程只运行在内核态，而普通进程既可以运行在内核态，也可运行在用户态。

2、因为内核线程只运行在内核态，它只使用大于PAGE_OFFSET的线性地址空间。另一方面，不管在用户态还是在内核态，普通进程可以用4GB的线性地址空间。

撤销进程：进程终止后，需要通知内核以便内核释放进程所拥有的资源，包括内存、打开文件以及其他资源，如信号量。进程终止的一般方式是调用exit()库函数，该函数释放C函数库所分配的资源，执行编程者所注册的每个函数，并结束从系统回收进程的那个系统调用。

除了进程自己终止自己外，内核可以有选择地强迫整个线程组死掉。这发生在：当进程接收到一个不能处理或忽视的信号时，或者当内核正在代表进程运行时再内核态产生一个不可恢复的CPU异常时。

有两个终止用户态应用的系统调用：exit_group()系统调用，它终止整个线程组，即整个基于多线程的应用。do_group_exit()是实现这个系统调用的主要内核函数。exit()系统调用，它终止一个线程，而不管该线程所属线程组中的所有其他进程。do_exit()是实现这个系统调用的主要内核函数。

进程切换：进程切换又称为任务切换、上下文切换。它是这样一种行为，为了控制进程的执行，内核挂起当前在CPU上运行的进程，并恢复以前挂起的某个进程的执行。

跟函数的调用类似，进程切换时，一般要在CPU上装载要执行进程的进程上下文。进程的硬件上下文指：可执行程序上下文的一个子集，是进程恢复执行前装入寄存器的一组数据。其中一部分放在TSS段，即任务状态段，剩余部分存放在内核态堆栈中。进程的切换只发生在内核态，在执行进程切换之前，用户态进程使用的所有寄存器内容都已保存在内核态堆栈上。

进程的切换有两种方法，一种是硬件切换，一种是软件切换。软件切换就是利用程序逐步执行切换，它的优点是，可以对切换时装入的数据进行合法性检查，执行时间虽与硬件切换大致相同，但仍有可改进的地方。

进程切换使用schedule()函数完成，在本质上，每个进程切换由两部分组成：1、切换页全局目录以安装一个新的地址空间。2、切换内核态堆栈和硬件上下文，因为硬件上下文提供了内核执行新进程所需要的所有信息，包括CPU寄存器，主要有switch_to函数完成。

更多详情见请继续阅读下一页的精彩内容：

推荐文章：

Linux内核之进程管理