https://juejin.cn/post/6891918738846105614
前言
C++中的对象释放由程序员负责,而Java中的对象释放则由GC负责。如果一个Java对象通过指针持有native对象,那么应该何时释放native对象呢?靠原有的GC自然搞不定,因为虚拟机无法得知这个Java对象的long型字段是不是指针,以及该指向哪个native对象。
早先的做法是在Java类中实现finalize方法,该方法会在Java对象回收的时候得到调用。这样我们便可以在finalize方法中去释放native对象,让Java资源和native资源在GC过程中同时释放。不过finalize方法有诸多缺陷,最终在JDK 9中被弃用。替代它的是Cleaner类。
1. 需要解决的问题
如何在Java对象被回收的时候,自动释放其所关联的native对象和资源?
这是finalize和Cleaner想要解决的问题。纯Java层面的应用开发通常不会涉及到Java对象持有native对象指针的设计,但对一些复杂的类而言,这种设计不可或缺。譬如大家经常用到的Bitmap,就是通过这种方式将大部分内存消耗放到native堆而不是Java堆。
1.1 Finalize的缺点
Finalize用起来很方便。覆写一个方法,在方法里面释放资源,两步就可以搞定native资源的释放,所以也被广大开发者所喜爱。可是方便有时需要付出代价。性能的牺牲是一方面,在某些场景下导致的内存错误则更加无法忍受。Android Runtime团队的大佬Hans Boehm在Google IO 2017曾就这个问题专门做过演说,里面提到的finalize的3个缺点,感兴趣的可以去油管上查看:链接,我在这里简单总结下。
如果两个对象同时变成unreachable,他们的finalize方法执行顺序是任意的。因此在一个对象的finalize方法中使用另一个对象持有的native指针,将有可能访问一个已经释放的C++对象,从而导致native heap corruption。
根据Java语法规则,一个对象的finalize方法是可以在它的其他方法还在执行时被调用的。因此其他方法如果正在访问它所持有的native指针,将有可能发生use-after-free的问题。
如果Java对象很小,而持有的native对象很大,则需要显示调用System.gc()以提早触发GC。否则单纯依靠Java堆的增长来达到触发水位,可能要猴年马月了,而此时垃圾的native对象将堆积成山。
提到Hans Boehm,我有个感触想跟大家分享下。这位前辈74年上的本科(估算65岁左右),康奈尔博士毕业,然而至今仍然奋战在项目一线,ART中很多关键代码都是他提交的。我曾经邮件向他请教过问题,他为人十分和善,对于像我这种菜鸡提的问题也回答得十分详细。按照国内35岁辞退的浮躁心态来看,他这么大年纪没混成个领导,还在一线写代码,真是失败。但看到他的个人简介,你还能说出这样的话么?
1.2 Cleaner的优点
根据源码中的注释可以知道,Cleaner是一种finalization的方式,它可以跟踪某个对象的生命周期,并且封装任意的cleanup代码。在GC释放完该对象后,reference-handler thread会运行封装的cleanup代码来完成资源释放。
由于Cleaner继承于PhantomReference(虚拟引用),相比于finalize的方式,它限定了很多能力,譬如访问跟踪对象的能力。由于这些能力的限定,所以它同时也避免了finalize的诸多缺陷。说白了,finalize的很多缺陷都是由于它太“能干”了。