进程
- 从硬盘编译代码为可执行文件之后,被装载到内存中。通过CPU来执行程序的指令,这个程序的运行实例,就为进程。
-
一个单核的CPU在进程从硬盘读取数据时,不选择阻塞等待数据返回,而选择执行别的进程。在硬盘数据返回后,CPU收到中断,继续运行这个进程。这就是多个程序、交替执行的并发操作。
一个进程活动的三种状态
1.阻塞状态:该进程正在等待某⼀事件发⽣(如等待输⼊/输出操作的完成)⽽暂时停⽌运⾏,这时,即使给它CPU控制权,它也⽆法运⾏
2.运行状态:该时刻进程占⽤ CPU;
3.就绪状态:可运⾏,由于其他进程处于运⾏状态⽽暂时停⽌运⾏;
另两个基本状态:
创建状态;
结束状态。
进程调度器、时间片
进程控制结构
- 通过进程控制块(process control block,PCB)这样的数据结构来描述进程
- PCB是进程存在的唯⼀标识
包括有以下信息:
进程标识符
⽤户标识符
进程当前状态
进程优先级
资源分配清单:有关内存地址空间或虚拟地址空间的信息,所打开⽂件的列表和所使⽤的 I/O 设备信息。
CPU 相关信息:CPU 中各个寄存器的值,当进程被切换时,CPU 的状态信息都会被保存在相应的 PCB 中,以便进程重新执⾏时,能从断点处继续执⾏。
通过链表的方式组织PCB:(更灵活的插入和删除,还有索引的方式来组织PCB)
将就绪状态的进程链在一起,为就绪队列
将等待状态的进程链在一起,为阻塞队列
CPU上下文切换
CPU的寄存器和程序计数器(存储指令位置)的环境,由系统内核存储。
4.进程上下文切换是什么,保存了哪些信息,有哪些场景?
进程的上下文切换
完整的上下文切换:
进程运行于用户态,然后因为系统调用或时间片耗尽切换到内核态执行指令,完成上下文切换后回到用户态,进程被切换。
上下文主要包括寄存器、程序计数器、栈、虚拟内存地址、内核数据结构(页表、文件表、进程表)
1.时间片耗尽(为了进程的公平调度,CPU时间被分为一段段的时间片,被分配给各个进程,某个进程的时间片耗尽了,进程就从运行状态变为就绪状态)
2.系统资源不足(内存不足)
3.sleep函数的主动挂起
4.高优先级的进程运行
5.硬件中断
调度的五大原则
1.CPU利用率高(进程阻塞时选择其他作业来进行)
2.系统吞吐量大(权衡厂作业和短作业的完成数量)
3.等待时间短(就绪作业的等待时间)
4.周转时间短(周转时间:作业从提交到完成的时间)
5.响应时间短(鼠标/键盘等交互式较强的应用,响应时间越短越好)
进程调度算法
非抢占式
1.先来先服务(短作业需要等待长作业执行完毕才能执行,等待时间过长)
2.短作业优先(长作业可能永远得不到调度)
抢占式
3.最短剩余时间优先
4.时间片轮转(效率和时间片大小有关,时间片太小,进程切换频繁影响效率,时间过长,实时性无法保证)
5.优先级调度(为了防止低优先级的进程永远等不到调度,可以随着时间的推移增加等待进程的优先级)
6.多级反馈队列(越上面的队列优先级越高,时间片长度越小)
线程
线程是进程当中的⼀条执⾏流程
同⼀个进程内多个线程之间可以共享代码段、数据段、打开的⽂件等资源
5.进程与线程的区别
进程是资源分配拥有的基本单位(内存,打开的文件以进程为单位分配).线程是程序执行调度的基本单位(系统的调度可以看成是对于线程的调度,当进程里面只有一个主线程的时候,就是调度了主线程,当有多个线程的时候,进程只是给这些线程提供了虚拟内存,全局变量的资源,真正进行的调度就是线程在并发的运行)
不同方向的区别
- 拥有资源:进程拥有CPU/内存/文件资源,而线程只独享寄存器和栈的资源,线程共享一个地址空间.
- 并发性:不同进程之间的切换来实现并发,不同的进程各自占有CPU
- 系统开销:进程创建销毁、切换开销都很大,线程切换只需要保存少量寄存器/程序计数器的内容
- 通信方式:进程借助操作系统进行通信(进程间通信方式),线程直接读写进程数据段(全局变量)进行通信。
进程装载过程,资源不可分割.处理机可以切换进程上下文,处理机切换线程上下文.把调度看成是任务的切换,或者说是陷入内核空间上下文切换.(协程的上下文切换仅在用户态进行)
进程独立拥有自己的资源,线程共享资源
进程的fork时相当于复制了一块虚拟内存和物理内存(但是linux是写时复制,也就是没有写操作的时候,两块虚拟内存指向同一块物理内存,到写操作发生时再复制到新的物理内存上)
线程不存在真正的单核并行运行
同一进程下的所有线程是之间共享了虚拟内存,
6.多进程和多线程的区别
可靠性.分布式
7.进程的哪些资源是线程共享的?
堆,全局数据,代码段,文件,地址空间,子进程,注册的信号.
8.多进程相比于多线程有什么优势?
1.隔离性好,进程间不会相互影响多线程中一个线程挂掉会导致所有线程都挂掉.为什么?
2.减少线程加锁解锁的性能损失
3.可以拥有理论全部的地址空间(而非共享)
4.数据同步更简单(共享复杂)