参考://www.greatytc.com/p/23f8249886c6
垃圾回收
(一)垃圾判断算法
1、引用计数法
引用计数算法是将垃圾回收分摊到整个应用程序的运行当中了,而不是在进行垃圾收集时,要挂起整个应用的运行,直到对堆中所有对象的处理都结束。因此,采用引用计数的垃圾收集不属于严格意义上的Stop-The-World的垃圾收集机制
2、可达性分析算法
通过
GC ROOT
的对象作为搜索起始点,通过引用向下搜索,所走过的路径称为引用链
。通过对象是否有到达引用链的路径来判断对象是否可被回收(可作为GC ROOT的对象:
虚拟机栈中引用的对象,方法区中类静态属性引用的对象,方法区中常量引用的对象,本地方法栈中JNI引用的对象)
(二)垃圾回收算法
1、标记-清除算法
标记-清除算法(Mark-Sweep)是最基础的一种垃圾回收算法,它分为2部分,先把内存区域中的这些对象进行标记,哪些属于可回收标记出来,然后把这些垃圾拎出来清理掉。清理掉的垃圾就变成未使用的内存区域,等待被再次使用。
问题:内存碎片、标记清除效率不高
2、复制算法
复制算法(Copying)是在标记清除算法基础上演化而来,解决标记清除算法的内存碎片问题。它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。保证了内存的连续可用,内存分配时也就不用考虑内存碎片等复杂情况。
问题:每次可用内存缩小一半
3、标记-整理算法
标记-整理算法(Mark-Compact)标记过程仍然与标记-清除算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,再清理掉端边界以外的内存区域。
问题:对内存变动更频繁,需要整理所有存活对象的引用地址,效率低于复制算法
4、分代收集算法
分代收集算法(Generational Collection)融合了上述3种基础的算法思想,根据对象存活周期的不同将内存划分为几块。
(1)在新生代
中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。
(2)在老年代
中,因为对象存活率高、没有额外空间对它进行分配担保,就必须使用标记-清理算法或者标记-整理算法来进行回收。
(三)垃圾收集器
1、Serial收集器
(1)最基本,发展最悠久;
(2)单线程垃圾收集器(“Stop The World”);
(3)桌面应用场景(因为虚拟机分配到的内存空间不大,用户停顿时间在毫秒级);
2、ParNew收集器
实际上就是Serial收集器的多线程版本,使用多线程进行垃圾收集(多个垃圾GC线程);
可与CMS收集器(Concurrent Mark Sweep)配合工作;
这里引入“并行”和“并发”的区别:
“并行”
:指多条垃圾收集进程并行工作,但此时用户线程仍处于等待状态;
“并发”
:指用户进程和垃圾收集进程同时执行(但不一定是并行的,可能会交替执行),用户程序继续执行,垃圾收集进程运行于另一个CPU上。
3、Paraller Scavenge收集器
(1)复制算法(新生代收集器)
(2)多线程收集器
(3)达到可控制的吞吐量:
-XX:MaxGCPauseMillis垃圾收集器最大停顿时间
-XX:GCTimeRatio吞吐量(倒数)大小:如果值设置为19,那允许的最大GC时间就占总时间的5%---1/(1+19)
吞吐量(Throughput):CPU用于运行用户代码的时间与CPU总消耗时间的比值,即
吞吐量 = 运行用户代码时间 / (运行用户代码时间 + 垃圾收集时间)。
停顿时间
越短就月适合需要与用户交互的程序,良好的相应速度能提升用户体验;另外,GC停顿时间缩短是以牺牲吞吐量和新生代空间来换取的,相应的是垃圾收集频率的提升
高吞吐量
则能高效率地利用CPU时间,尽快完成程序运算任务,主要适合在后台运算而不需要太多交互的任务
(4)重要特性:
-XX:+UseAdaptiveSizePolicy
(开关参数),这个参数打开之后,就不需要手工指定一些细节参数,只需设置基本的内存数据设置等以及停顿时间、吞吐量,虚拟机能根据当前系统的运行情况收集性能监控信息,动态调整
这些参数以提供最合适的停顿时间或者最大的吞吐量,这叫做GC的自适应调节策略
(GC Ergonomics)。
(5)适用于服务器端;
(6)无法与CMS收集器配合工作。
4、CMS收集器(Concurrent Mark Sweep)
CMS收集器以获取最短回收停顿时间
为目标
其工作过程分为4个步骤:
(1)初始标记(CMS initial mark)
(2)并发标记(CMS concurrent mark)
(3)重新标记(CMS remark)
(4)并发清除(CMS concurrent sweep)
其中步骤1、3需要“Stop The World”,步骤1、2、4是单线程,步骤3是多线程;另外步骤2、4耗时最长,并能和用户程序并行执行。
优点:低停顿
,并发收集
缺点:
1)占用大量CPU资源
;
2)无法处理浮动垃圾(Floating Garbage)
;
浮动垃圾是指每次并发清除时,用户线程所产生未能标记的新垃圾,待下一次GC时才会被清除。因此CMS会预留一部分空间提供并发收集时的用户程序使用,可以通过
-XX:CMSInitiatingOccupancyFration
,如果设置的太小会出现“Concurrent Mode Failure”失败,在JDK1.6以后,此时会临时启用Serial Old收集器。
3)空间碎片
,给大对象的分配带来很大麻烦。
注意:当出现“Concurrent Mode Failure”失败、或者存在大量空间碎片时,会触发Full GC。
5、G1收集器
G1(Garbage-First)收集器是当前最前沿的垃圾收集器
(面向服务端应用)
(1)步骤:
1)初始标记
(Initial Marking)
2)并发标记
(Concurrent Marking):将这个阶段对象变化记录在线程Remembered Set Log中;
3)最终标记
(Final Marking):将前一阶段的记录数据合并到Remember Set中,此时要停顿线程,而且可以并行执行;
4)筛选回收
(Live Data Counting and Evacuation):首先对各个Region的回收价值和成本进行排序,根据用户所期望的GC停顿时间来制定回收计划。
(2)优点:
1)并行与并发
:充分利用多CPU、多核环境的硬件优势,缩短Stop-The-World停顿的时间;
2)分代收集
:将整个Java堆划分成多个大小相等的独立区域(Region),仍保留新生代、老年代的概念;
3)空间整合
:基于“标记-整理”的算法,不会产生空间碎片,有利于程序长时间运行;
4)可预测的停顿
(重要优势):除了降低停顿时间外,还能建立可预测的停顿时间模型,即明确指定M毫秒的时间片段内,消耗在垃圾收集上的时间不超过N毫秒。
G1会跟踪每个Region里面的
垃圾堆积的价值
大小(回收所获得的空间大小以及回收所需时间的经验值),在后台维护一个优先列表,根据允许的收集时间,优先回收价值最大的Region;
另外有一个重要的问题:怎么解决垃圾回收时两个Regoin之间或者老年代与新生代之间的引用问题?
虚拟机使用Remembered Set
来避免全堆扫描。程序在堆Reference类型的数据进行写操作时,会产生一个Write Barrier
暂时中断写操作,检查其引用对象是否处于不同区域,如果是,则通过CardTable
把相关引用信息记录到被引用对象所属的Region的Remembered Set之中。这样在垃圾回收时,在GC Root的枚举范围中加入Remembered Set即可保证不对全堆扫描也不会有遗漏。
6、Serial Old收集器
Serial收集器的老年代版本,同样是一个单线程收集器,使用“标记-整理”
算法;
主要在Client模式下的虚拟机使用;
jdk8已放弃使用
7、Parallel Old收集器
Parallel Scavenge收集器的老年代版本,使用多线程,以及“标记-整理”算法;
在注重吞吐量以及CPU资源敏感的场合,都可以优先考虑Parallel Scavenge / Parallel Old组合