前言:在之前的Redis面试套路拆解的文章[Redis面试套路拆解(一)]中有提到过IO模型,并且IO模型本身也是一个比较容易混淆的高频面试考点,小黑板将在本篇文章帮你理清思路,区分各种IO模型~
其实网络上已经有很多博客讲了这个问题,但是总是觉得看完之后还是迷迷糊糊的,感觉大家有点太执着于把这个问题讲的通俗易懂了,经常会举各种各样的例子,比如烧水、去银行办理业务之类的,然而看完之后反倒会产生更多的疑问,因为可能举得例子并不能完美的适用于同步异步、阻塞非阻塞的概念
所以我们今天就不举例子了,小黑板想从专业概念的角度来帮助大家理解各种概念~
在讨论问题之前,我们需要确定一下上下文,以免产生误解,本文讨论的背景是基于Linux的网络IO开展的
实际上无论是哪一种IO模型,都可以分为两个阶段(以read操作为例):
等待数据准备就绪
将数据从内核态拷贝到用户空间
这里我们需要解释一下,什么是内核态和用户态
用户态:也称为用户空间,即上层应用程序的活动空间,应用程序的执行必须依赖于内核提供的资源
内核态:也称为内核空间,控制计算机的硬件资源,并提供上层应用程序运行的环境
注:用户态可以通过系统调用切换到内核态,这是主动进入到内核态。此外在出现异常或者外围设备的中断也会进入到内核态,不过是被动响应的
先说结论:各种IO模型其实是根据它在上述两个阶段的不同表现(用户进程或者线程是否阻塞)来区分的!!!
在第一个阶段用户进程是否阻塞用来区分阻塞/非阻塞,在第二个阶段用户是否阻塞用来区分同步/异步!!!
阻塞IO
当用户进程发起系统调用recvfrom时,在第一阶段,内核首先会等待****数据准备就绪,这个过程中用户进程是阻塞的;在第二阶段,当数据准备就绪之后,数据会从内核空间拷贝到用户空间(应用程序空间),这个过程中用户进程同样是阻塞的,直到数据拷贝完成才恢复。
所以,阻塞IO在两个阶段都是阻塞的!!
非阻塞IO
非阻塞IO和阻塞IO相似,区别在于第一阶段,在等待数据准备就绪的过程中,用户进程不会阻塞,而是在数据没有准备就绪的时候得到一个error返回,这是用户进程就知道数据还没有准备好,然后就可以继续发起recvfrom操作直到数据准备就绪
在第二阶段,数据从内核空间向用户空间拷贝时,非阻塞IO用户进程同样是阻塞的
IO多路复用
IO多路复用实际上是通过select/epoll等函数轮询多个socket,当用户进程调用了select函数,整个用户进程就会被阻塞,直到收到数据准备就绪的返回
后续的操作和非阻塞IO是类似的,由于在recvfrom系统调用之前,需要的数据就已经准备就绪了,所以第一个阶段是非阻塞的;第二个阶段同样还是阻塞的
所以IO多路复用整个过程中,用户进程都是阻塞的~
异步IO
异步IO实际上是用户进程发起read操作之后,就会立刻收到一个返回,所以用户进程就可以去完成其他的工作,而不需要阻塞;直到数据准备就绪并且完成了从内核空间向用户空间拷贝的工作,这时用户进程会收到一个通知,告诉他read操作已完成
整个过程中用户进程不会被阻塞
总结
所以实际上阻塞IO和非阻塞IO都是同步IO,用到了特殊的异步函数才是异步IO
如果能从IO过程的两个阶段来看待这些问题,就不会被这些概念和一些例子绕晕了
关注【后端技术小黑板】,发送“面试套路”,更多的面试套路拆解和知识分享等你哟~