1.原生 NIO 存在的问题
- NIO 的类库和 API 繁杂,使用麻烦:需要熟练掌握 Selector、ServerSocketChannel、
SocketChannel、ByteBuffer等。 - 需要具备其他的额外技能:要熟悉 Java 多线程编程,因为 NIO 编程涉及到 Reactor 模式,你必须
对多线程和网络编程非常熟悉,才能编写出高质量的 NIO 程序。 - 开发工作量和难度都非常大:例如客户端面临断连重连、网络闪断、半包读写、失败缓存、网络拥
塞和异常流的处理等等。 - JDK NIO 的 Bug:臭名昭著的 Epoll Bug,它会导致 Selector 空轮询,最终导致 CPU 100%。直到
JDK 1.7版本该问题仍旧存在,没有被根本解决
( Epoll Bug:在NIO中通过Selector的轮询当前是否有IO事件,根据JDK NIO api描述,Selector的select方
法会一直阻塞,直到IO事件达到或超时,但是在Linux平台上这里有时会出现问题,在某些场
景下select方法会直接返回,即使没有超时并且也没有IO事件到达,这就是著名的epoll
bug,这是一个比较严重的bug,它会导致线程陷入死循环,会让CPU飙到100%,极大地影
响系统的可靠性,到目前为止,JDK都没有完全解决这个问题。)
2.netty介绍
Netty 是由 JBOSS 提供的一个 Java 开源框架。Netty 提供异步的、基于事件驱动的网络应用程序框
架,用以快速开发高性能、高可靠性的网络 IO 程序。 Netty 是一个基于 NIO 的网络编程框架,使用
Netty 可以帮助你快速、简单的开发出一 个网络应用,相当于简化和流程化了 NIO 的开发过程。 作为
当前最流行的 NIO 框架,Netty 在互联网领域、大数据分布式计算领域、游戏行业、 通信行业等获得了
广泛的应用,知名的 Elasticsearch 、Dubbo 框架内部都采用了 Netty。
Netty 的强大之处:零拷贝、可拓展事件模型;支持 TCP、UDP、HTTP、WebSocket 等协议;提供安全传输、压缩、大文件传输、编解码支持等等。
具备如下优点:
- 设计优雅,提供阻塞和非阻塞的 Socket;提供灵活可拓展的事件模型;提供高度可定制的线程模型。
- 具备更高的性能和更大的吞吐量,使用零拷贝技术最小化不必要的内存复制,减少资源的消耗。
- 提供安全传输特性。
- 支持多种主流协议;预置多种编解码功能,支持用户开发私有协议
3.线程模型
(1)线程模型基本介绍
不同的线程模式,对程序的性能有很大影响,在学习Netty线程模式之前,首先讲解下 各个线程模
式, 最后看看 Netty 线程模型有什么优越性.目前存在的线程模型有:
传统阻塞 I/O 服务模型
Reactor 模型
根据 Reactor 的数量和处理资源池线程的数量不同,有 3 种典型的实现
·单 Reactor 单线程
·单 Reactor 多线程
·主从 Reactor 多线程
(2)传统阻塞 I/O 服务模型
采用阻塞 IO 模式获取输入的数据, 每个连接都需要独立的线程完成数据的输入 , 业务处理和数据返回
工作.
存在问题:
- 当并发数很大,就会创建大量的线程,占用很大系统资源
- 连接创建后,如果当前线程暂时没有数据可读,该线程会阻塞在 read 操作,造成线程资源浪费
(3)Reactor 模型
Reactor 模式,通过一个或多个输入同时传递给服务处理器的模式 , 服务器端程序处理传入的多个
请求,并将它们同步分派到相应的处理线程, 因此 Reactor 模式也叫 Dispatcher模式. Reactor 模式使用
IO 复用监听事件, 收到事件后,分发给某个线程(进程), 这点就是网络服务器高并发处理关键
单Reactor单线程:
·Selector是可以实现应用程序通过一个阻塞对象监听多路连接请求
·Reactor 对象通过 Selector监控客户端请求事件,收到事件后通过 Dispatch 进行分发是建立连接请求事件,则由 Acceptor 通过 Accept 处理连接请求,然后创建一个 Handler 对象处理连接完成后的后续业务处理
·Handler 会完成 Read→业务处理→Send 的完整业务流程
优点: 模型简单,没有多线程、进程通信、竞争的问题,全部都在一个线程中完成
缺点:
- 性能问题: 只有一个线程,无法完全发挥多核 CPU 的性能。Handler 在处理某个连接上的业务时,
整个进程无法处理其他连接事件,很容易导致性能瓶颈 - 可靠性问题: 线程意外终止或者进入死循环,会导致整个系统通信模块不可用,不能接收和处
理外部消息,造成节点故障
单Reactor多线程
·Reactor 对象通过 selector 监控客户端请求事件, 收到事件后,通过 dispatch 进行分发
·如果建立连接请求, 则右 Acceptor 通过accept 处理连接请求
·如果不是连接请求,则由 reactor 分发调用连接对应的 handler 来处理
·handler 只负责响应事件,不做具体的业务处理, 通过 read 读取数据后,会分发给后面的worker 线程池的某个线程处理业务
·worker 线程池会分配独立线程完成真正的业务,并将结果返回给 handler
·handler 收到响应后,通过 send 将结果返回给 client
优点:
可以充分的利用多核 cpu 的处理能力
缺点:
多线程数据共享和访问比较复杂, reactor 处理所有的事件的监听和响应,在单线程运行, 在
高并发场景容易出现性能瓶颈
主从Reactor多线程
·Reactor 主线程 MainReactor 对象通过 select 监听客户端连接事件,收到事件后,通过Acceptor 处理客户端连接事件
·当 Acceptor 处理完客户端连接事件之后(与客户端建立好 Socket 连接),MainReactor 将连接分配给 SubReactor。(即:MainReactor 只负责监听客户端连接请求,和客户端建立连
接之后将连接交由 SubReactor 监听后面的 IO 事件。)
·SubReactor 将连接加入到自己的连接队列进行监听,并创建 Handler 对各种事件进行处理当连接上有新事件发生的时候,SubReactor 就会调用对应的 Handler 处理
·Handler 通过 read 从连接上读取请求数据,将请求数据分发给 Worker 线程池进行业务处理
·Worker 线程池会分配独立线程来完成真正的业务处理,并将处理结果返回给 Handler。Handler 通过 send 向客户端发送响应数据
·一个 MainReactor 可以对应多个 SubReactor,即一个 MainReactor 线程可以对应多个
SubReactor 线程
优点:
- MainReactor 线程与 SubReactor 线程的数据交互简单职责明确,MainReactor 线程只需要
接收新连接,SubReactor 线程完成后续的业务处理 - MainReactor 线程与 SubReactor 线程的数据交互简单, MainReactor 线程只需要把新连接
传给 SubReactor 线程,SubReactor 线程无需返回数据 - 多个 SubReactor 线程能够应对更高的并发请求
缺点:
这种模式的缺点是编程复杂度较高。但是由于其优点明显,在许多项目中被广泛使用,包括
Nginx、Memcached、Netty 等。这种模式也被叫做服务器的 1+M+N 线程模式,即使用该模式开
发的服务器包含一个(或多个,1 只是表示相对较少)连接建立线程+M 个 IO 线程+N 个业务处理
线程。这是业界成熟的服务器程序设计模式。