标记-清除算法
标记-清除算法是现代垃圾回收算法的思想基础。标记-清除算法将垃圾回收分为两个阶段:标记阶段和回收阶段。一种可行的实现方式是,在标记阶段,首先通过根节点标记所有从根节点开始的可达对象,因此未被标记的对象就是未被引用的垃圾对象。然后,在清除阶段清除所有的未被标记的对象。
标记-清除算法可能产生的最大问题就是空间碎片。
回收后的空间是不连续的,在对象的堆空间分配过程中,尤其是大对象的内存分配,不连续的内存空间的工作效率要低于连续的空间,这也是标记-清除算法的最大缺点。
复制算法
与标记-清除算法相比,复制算法是一种相对高效的回收方法。它的核心思想是:将原有的内存空间分为两块,每次只使用其中的一块,在垃圾回收时,将正在使用的内存中的存活对象复制到未使用的内存块中,之后清除正在使用的内存块中的所有对象,交换两个内存的角色,完成垃圾回收。
如果系统中的垃圾对象很多,复制算法需要复制的存活对象数量并不会太大。因此,在真正需要垃圾回收的时刻,复制算法的效率是很高的。又因为对象是在垃圾回收过程中统一被复制到新的内存空间中的,因此可确保回收回的内存空间是没有碎片的。虽然有以上两大优点,但是复制算法的代价是将系统内内存折半,因此,单纯的复制算法也很难让人接受。
如上图所示,有A、B两块相同的内存空间,A在进行垃圾回收时将存活对象复制到B中,B中的空间在复制后保持连续。复制完成后,清空A,并将空间B设置为当前使用空间。
在Java的新生代串行垃圾回收器中使用了复制算法的思想。新生代分为eden空间、from空间和to空间3个部分。其中,from和to空间可以视为用于复制的两块大小相同、地位相等且可以进行角色互换的空间快。from和to空间也成为survior空间,即幸存者空间,用于存放未被回收的对象。
在垃圾回收时,eden空间中的存活对象会被复制到未使用的survivor空间中(假设是to),正在使用的survivor空间(假设是from)中的年轻对象也会被复制到to空间中(大对象,或者老年对象会直接进入老年代,如果to空间已满,则对象也会直接进入老年代)。此时,eden空间和from空间中的剩余对象就是垃圾对象,可以直接清空,to空间则存放此次回收后的存活对象。
这种改进的复制算法既保证了空间的连续性,有避免了大量的内存空间浪费。复制算法比较适合新生代。因为在新生代中,垃圾对象通常会多于存活对象,复制算法的效果会比较好。
标记-压缩算法
复制算法的高效性是建立在存活对象少,垃圾对象多的前提下,这种情况在年轻代经常发生,但是在老年代,更常见的情况是大部分对象都是存活对象,如果依然使用复制算法,由于存活对象较多,复制的成本也将提高。因此基于老年代垃圾回收的特性,需要使用新的算法。
标记压缩算法是一种老年代的回收算法,它在标记-清除算法的基础上做了一些优化。和标记清除算法一样,标记压缩算法也需要首先从根节点开始对所有可达对象做一次标记。但之后,它不是简单地清理未标记的对象,而是将多有存活对象压缩到内存的一端,之后清理边界外的所有的空间。
这种方法既可避免了碎片的产生,又不需要两块相同的内存空间,因此其性价比较高。
增量算法
增量算法的基本思想是,如果一次性将所有的垃圾进行处理,需要造成系统长时间的停顿,那么可以让垃圾收集线程和应用程序交替执行。垃圾收集线程每次只收集一小片区域的内存空间,接着切换到应用程序线程。如此反复,直到垃圾回收完成。使用这种方式,由于垃圾回收的过程中间断地还执行了应用程序的代码,所以能减少系统的停顿时间。但是因为线程切换和上下文转换的消耗,使得垃圾回收的总体成本上升,造成系统吞吐量的下降。
分代
以Hot Spot虚拟机为例,它将所有的新建对象都放入称为年轻代的内存区域,年轻代的特点是朝生夕死,大约90%的新建对象会很快被回收,因此,在年轻代就要选择效率较高的复制算法。
当一个对象经过几次回收后依然存活,对象就会被放入称为老年代的内存空间。在老年代中,几乎所有的对象都是经过几次垃圾回收后依然得以幸存的,因此可以认为这些对象在一段时期内,甚至在应用程序的整个生命周期中将是常驻内存的。在极端情况下,老年代的存活率可以达到100%,如果依然使用复制算法回收老年代,将需要复制大量对象。再加上老年代的回收性价比也要低于新生代,因此这种做法是不可取的,可以对老年代的回收使用标记压缩算法,以提高垃圾回收效率。