进程,通常被说成执行中的程序。其实我觉得也可以理解成程序的一个实例化对象,所以它除了拥有代码段,还有堆栈段,数据段和堆来动态地分配实体所需的内存。
进程有不同的状态,Linux内核通过一个结构体task_struct 来管理进程。这个结构体的定义可以在内核文件中找到(我的路径是linux-5.0/include/linux/sched.h)。
Linux 下的主要进程状态有:
1, R(TASK_RUNNING) –可执行状态
2, S(TASK_INTERRUPTIBLE) –可中断的睡眠状态
3, D(TASK_UNINTERRUPTIBLE) –不可中断的睡眠状态
4, T(TASK_STOPPED or TASK_TRACED) –暂停状态或跟踪状态
5, Z(TASK_DEAD) –退出状态,也称僵尸状态
接下来就稍微简略地介绍一下,各个进程状态的特点。
* R(TASK_RUNNING) –可执行状态:
通过将进程的task_struct结构放到CPU的可执行队列中,使进程变成R态。只有处在该状态的进程才有可能被进程调度器选中在CPU上执行。
注意:可执行但未被调度执行的进程在Linux中也被定义为TASK_RUNNING态。
* S(TASK_INTERRUPTIBLE) –可中断的睡眠状态:
当进程需要等待某件事的发生,比如socket连接等待对方输入时,进程的task_struct结构被放入相应事件的等待队列中。当事件被触发时,相应事件的等待队列中的某些进程就会被唤醒。
* D(TASK_UNINTERRUPTIBLE) –不可中断的睡眠状态:
进程此时也是处于睡眠状态,但是不可以被kill掉,除非祭出reboot毁天灭地。为什么要设置一种不可中断的睡眠状态呢?原来是为了保护内核状态下的某些流程不被打断。
* T(TASK_STOPPED or TASK_TRACED) –暂停状态或跟踪状态:
TASK_STOPPED 和TASK_TRACED都表示进程被暂停下来,但不同的是TASK_STOPPED状态下,进程可以被SIGCONT信号唤醒,而TASK_TRACED下进程不能被该信号唤醒。TASK_TRACED状态通常发生在调试时,进程在断电处停下来,此时即被跟踪,只有当完成调试时,才能返回TASK_RUNNING状态。
* Z(TASK_DEAD) –退出状态,也称僵尸状态:
‘’’进程在退出的过程中,处于TASK_DEAD状态。
在这个退出过程中,进程占有的所有资源将被回收,除了task_struct结构(以及少数资源)以外。于是进程就只剩下task_struct这么个空壳,故称为僵尸。’’’(摘自:https://blog.csdn.net/sdkdlwk/article/details/65938204)。如果父进程不退出,那么僵尸状态的子进程就一直存在。
还可以对比一下OS的一般进程状态图,与Linux下的进程状态图。可以更加生动地理解Linux下各个进程状态的转换关系:
第一张图来自于课本(《操作系统概念》第七版),第二张图来自(http://www.cnblogs.com/wang_yb/archive/2012/08/20/2647912.html) 。可以很明显地看到Ready和Running态在Linux下均为R态,以及通过不同的函数调用来实现进程状态的转变。
最后,还可以通过ps命令在Linux下来查看当前所有进程的状态,我使用ps axu,结果如下:
可以发现,基本上进程状态都处于S态,拉到最下面才发现一个处于R态的进程。其实这也很好解释,因为CPU就仅仅一两个,而进程经常是几百个,若不是绝大多数进程都处在S态,CPU就无法响应过来了。
谢谢各位客官阅读,个人水平有限,有错误之处望指正。