OSI七层网络模型
在了解IO之前,先看看OSI网络模型
从上面两个图可以看出,如果主机A的应用a与主机B的应用b之间建立了一条tcp连接,通过这条tcp连接进行通信时,其数据流向为:
a应用层(应用层、表示层、会话层) → A传输层 → A网络层 → A数据链路层 → A物理层 → B物理层 → B数据链路层 → B网络层 → B传输层 → b应用层
带着以下两个疑问,进行下面的学习
①传输层(tcp协议)由操作系统内核实现,application怎么与内核进行交互?
②什么影响物理层之间的数据交互?
什么是IO?
从一个IO设备中read数据到内存中,或将内存中的数据write到这个设备中,这个过程称为IO,这个设备成为IO设备。而根据IO设备的不同,IO又分为磁盘IO和网络IO。通常我们所说的IO都指的是网络IO,BIO、NIO、IO多路复用技术指的都是网络IO。
IO发生在哪?
从上述的网络模型图及IO的定义来理解,IO的关键点在于应用进程与操作系统内核之间的数据读写,这通常也是很多中间件、业务系统的性能瓶颈所在,所以有很多技术用于解决此处的数据读写性能问题,比如IO多路复用。
用户态与内核态
操作系统存在多种cpu状态,用于权限控制。为了完成IO操作,cpu会在用户态与内核态之间切换,而系统调用(应用程序调用库函数触发内核切换至内核态)会让cpu从用户态切换至内核态。处于内核态时,才能对硬件设备进行操作,比如磁盘、网卡等,只有两种状态的配合下,才能完成整个网络IO过程。
特权环:R0、R1、R2和R3
R0相当于内核态,R3相当于用户态;
BIO & NIO
BIO:在进行accept、read、write、connect操作时,线程会进入阻塞状态,直到操作完成,比如进行read时,此时socket中没有数据,则线程阻塞,直到读到数据为止。
NIO:在进行accept、read、write、connect操作时,线程不会阻塞,比如read时,如果没有读到数据,则会立刻返回结果。
所以BIO模型下,每个线程只能处理一个socket的连接、数据的读写,在NIO模型下,一个线程可以对多个socket进行轮询处理。NIO相对于BIO的优势在于线程数少,占用内存少,对cpu资源的竞争小,cpu进行上下文切换的频率小。
public class SocketBIO {
public static void main(String[] args) throws IOException {
ServerSocket server = new ServerSocket(9090);
System.out.println("step1: new ServerSocket. port:" + server.getLocalPort());
while (true) {
// ①阻塞
Socket client = server.accept();
System.out.println("step2: client:" + client.getRemoteSocketAddress());
new Thread(new Runnable() {
@Override
public void run() {
InputStream inputStream = null;
try {
inputStream = client.getInputStream();
BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream));
while (true) {
// ②阻塞
String data = reader.readLine();
System.out.println("step3: data:" + data);
}
} catch (Exception e) {
}
}
}).start();
}
}
}
public class SocketNIO {
public static void main(String[] args) throws IOException, InterruptedException {
List<SocketChannel> clients = new LinkedList<>();
ServerSocketChannel serverSocketChannel = ServerSocketChannel.open();
serverSocketChannel.bind(new InetSocketAddress(9091));
serverSocketChannel.configureBlocking(false);
System.out.println("step1: new ServerSocketChannel. port:" + serverSocketChannel.socket().getLocalPort());
while (true) {
// ①不会阻塞
SocketChannel client = serverSocketChannel.accept();
if (client == null) {
System.out.println("client is null...");
} else {
client.configureBlocking(false);
System.out.println("step2: client:" + client.getRemoteAddress());
clients.add(client);
}
ByteBuffer buffer = ByteBuffer.allocate(4096);
for (SocketChannel c : clients) {
// ②不会阻塞
int num = c.read(buffer);
if (num > 0) {
buffer.flip();
byte[] byteData = new byte[buffer.limit()];
buffer.get(byteData);
String data = new String(byteData);
System.out.println("step3: client:" + c.getRemoteAddress() + ", data:" + data);
buffer.clear();
}
}
Thread.sleep(5000);
}
}
}
IO多路复用
从BIO、NIO模型中可以看出,我们在读写数据的时候,需要对每个socket进行read/write操作。如果存在1000个socket连接,那么BIO模型需要使用1000个线程处理这个多连接,浪费内存资源、cpu资源;NIO模型可以减少线程数,比如开启10个线程,每个线程处理100个socket连接,能缓解线程数的问题,但是对于socket连接的处理会存在消息读取不及时的延迟问题。
IO多路复用技术就是为了解决上述问题,通过将需要读写的文件描述符给到操作系统内核,由内核对这些文件描述符进行遍历、标识,最终应用程序对有读写请求的socket进行精准处理即可。
linux提供了select、poll、epoll,都是对IO多路复用技术的实现。通过结合使用NIO+IO多路复用,能解决大多数业务的网络IO问题。
小结
技术水平有限,以上是个人的理解,由于对计算机基础知识的各种缺乏,很多点都解释不清楚,后续还需要继续对基础知识进行学习。-.-