Buffer和Channel总是成对出现,在Java NIO中Buffer用于和NIO通道进行交互,数据总是从Chanel中读入缓冲区,然后在从缓冲区写入Channel中。
缓冲区本质上是一块物理上连续分配的内存区域,这块内存区域被包装成NIO Buffer对象,并提供了一组方法,用于方便的访问该内存区域。Buffer映射操作能够直接操作底层平台的资源。这些操作节省了在不同地址空间中复制数据的开销——这在现代计算机体系结构中是开销很大的操作(相比于Java 面向流的IO)。
1- 常用的Buffer类型
可以通过char,short,int,long,float 或 double类型来操作缓冲区中的字节, MappedByteBuffer,用于表示内存映射文件。
2- Buffer的分配
在使用Buffer之前需要先分配指定大小的内存区域。分配的缓冲区大小是定长的,不可以扩展容量。并将分配的缓冲区元素都置为0。
- 不同类型Buffer的分配
每个Buffer类型的数据都有一个allocate的静态方法来分配指定类型大小的缓冲数据区域,而且这些Buffer类型都是抽象类,不可实例化(但是可以使用类的静态方法)。
- ByteBuffer不同内存区域的Buffer分配
- 在Java堆上分配内存,HeapByteBuffer是NIO的包内访问权限类,包外不可获取,方法返回向上转型为ByteBuffer,其他Buffer类也都有这个方法,分配的是堆上内存区域(新建了一个byte数组)。
-
在堆外内存上分配缓冲区,只有ByteBuffer可以分配堆外缓冲区。
堆外内存使用unsafe.allocateMemory方法分配
但是可以先分配ByteBuffer的堆外内存,然后转换为其他类型的来访问。
还有堆外分配不一定能分配成功,需要进行判断
- 堆上(HeapByteBuffer) VS 堆外(DirectByteBuffer)
- 分配和销毁堆外直接内存缓冲区通常要比分配和销毁堆上缓冲区消耗更多的系统资源。
- DirectByteBuffer比HeapByteBuffer读写性能更高,可以提高网络交互的速度:HeapByteBuffer会发生频繁的直接内存和JVM堆内存之间的相互的拷贝,比如flush数据到远程的时候,会将JVM内存拷贝到直接内存然后才会进行数据发送的工作;而DirectByteBuffer是对直接内存的保证所以会省去内存拷贝的过程,这在计算操作系统中节省可观的性能消耗。
- 基于NIO的开源web框架如Netty,Nginx都基于DirectByteBuffer提高了整体读写性能。如Netty的ByteBuf完成了对ByteBuffer的包装和拓展,需要注意的是在NIO网络编程时只有ByteBuffer能和Channel进行读写交互,ByteBuf在于Channel进行交互时也是转换成了ByteBuffer之后再与Channel交互。
- 由于分配DirectByteBuffer比较消耗系统资源,但是又能提高读写性能,Netty的做法是分配DirectByteBuffer后自己根据引用计数做内存回收,重新复用DirectByteBuffer,而不是直接释放掉分配好的内存。
- DirectByteBuffer回收管理(程序员完全控制管理)
直接内存的释放是GC(full gc,调用System.gc())自动回收来控制的,并不由程序员控制,没有类似的close或者free等显示释放内存空间的方法,但是如何才能有程序员完全掌握回收的控制权呢?DirectByteBuffer有一个Cleaner域用于内存释放,给了程序猿一线生机。
- 设置JVM 参数DisableExplicitGC ,禁用full gc(这样DirectByteBuffer就不会被系统回收了) ,严重警告:禁用full gc,需要严格的测试,存在内存泄露的风险,必要进行堆外内存管理(其实Netty就是这么干的)
- DirectByteBuffer构造函数会新建一个Deallocator类来初始化这个Cleaner域
-
Deallocator是DirectByteBuffer静态内部类,含有一个run方法,方法内部使用unsafe.freeMemory释放分配的直接内存空间
-
Cleaner类有一个方法clean方法,调用的是传进去的Deallocator对象的run方法,可以用来释放分配的堆外直接内存。
- 代码示例
DirectByteBuffer实现了DirectBuffer接口,DirectByteBuffer是default访问权限,但是DirectBuffer是public,如果不是出于特殊考虑建议不要通过DirectBuffer直接操作DirectByteBuffer,容易造成安全隐患(这也是DirectByteBuffer定义为default访问权限的原因)
3- Buffer的使用
Buffer的使用一般搭配Channel
- 将数据读到Buffer中
- 将Buffer中数据读出
get方法也可以获取指定位置的数据
- position(位置)、capacity(容量)、limit(限制)
position指的是当前在缓冲数组中的位置;capacity指的是缓冲数组的大小,在创建时指定,代表着最大可存储的数据长度;limit指的是有效数据的长度,limit小于等于capacity。
- 读写模式转换时,PCL的变化
- 新建:position=0;limit = capacity
- 读入数据大小5byte:position = 5;limit=capacity
- flip(写->读)模式转换:position=0;limit=转换前position位置
- clear方法:和新建一样
- rewind方法:position=0;limit=保持不变
flip方法用于写->读转换,clear方法用于重置缓冲数组等待下一次将数据写入缓冲数组,rewind方法用于重读数组,需要注意的是这些只是position、limit 的位置在发生变化,缓冲数组的数据并没有被清除,只有下次写入才能将原来的数据覆盖。当将缓冲数组数据读出时,只会读出position-limit范围内的数据(有效数据),而不会读取limit-capacity之间的数据(上次写入时遗留的数据,等待被覆盖)。
其他的方法还有mark()与reset()方法,通过调用Buffer.mark()方法,可以标记Buffer中的一个特定position。之后可以通过调用Buffer.reset()方法恢复到这个position。这样就提供了在一个缓冲数组中反复遍历操作读入数据的便利和灵活性,而不像面向流的IO不能操作当前位置的前一个字节。