本系列文章属于《JVM G1源码分析和调优》读书笔记。感谢作者的付出!
G1概述和名词解析
G1特点:在满足短时间停顿的同时,达到一个高的吞吐量,适用于多核处理器,大内存的系统。
-
短停顿时间且可控:
- G1对内存进行分区,基于部分内存回收的新生代收集和混合收集。
-
高吞吐量:
- 优化GC工作,使其尽可能与Mutator并发工作;
- 设计了新的并发标记线程,用于并发标记内存;
- 设计了Refine线程并发处理分区之间的引用关系
FullGC:内存不足时,需要对全部内存(整个堆)进行垃圾回收,通常Full GC是串行的,G1的Full GC在JDK10之后有并行实现。
并发标记: G1新引入的,指Mutator运行的同时,标记哪些对象是垃圾。
传统垃圾回收的实现逻辑:暂停一切活动(Stop the world),回收器完美的识别哪些对象有用,哪些无用。
并发标记的实现逻辑:在标记垃圾的时候,同时记录系统增加了哪些对象,修改了哪些对象,增加了哪些垃圾等。在标记结束的时候,对这些发生过变更的对象重新标记一次 (再标记:remark)。当然,再标记需要STW,否则永远没有尽头。这也被称为 增量并发标记,G1中具体的算法为Snapshot-At-The-Beginging(SATB)。
Refine线程:G1新引入的,在进行部分收集的时候加速识别活跃对象。
-
JVM中重新定义了并发和并行
- 并行:指多个垃圾回收相关线程在操作系统上并发运行。强调的只有垃圾回收线程工作,其他的java 应用程序全部都暂停执行,因此parNew工作的时候一定发生STW(所以parNew被称为并行收集器)。
- 并发:指垃圾回收相关的线程并发运行,同时这些线程会和java应用程序并发运行。
Stop-The-World(STW):停止一切,在JVM中停止一切java应用线程。
安全点(safepoint):线程并不是在任何地方都可以进入stw,安全点是给线程提供一个可以安全进入stw的位置。
Mutator:特指java的应用线程。
Remember Set(Rset)记忆集:主要记录不同代际对象的引用关系。
Evacuation(Evac): 在G1中指发现活跃对象,并将对象复制到新地址的过程。
Reclaim 回收:通常指分区对象已经死亡或者完成Evac,分区可以被jvm再次使用。
Closure:闭包,提供对内存的访问。
GC Root:垃圾回收的根。垃圾回收过程中,需要从GC Root出发标记活跃对象,确保正在使用的对象在垃圾回收后都是存活的。
Root Set:在JVM的垃圾回收过程中,需要从不同的GC Root出发,GC Root中包含有线程栈,monitor列表,JNI对象等,这些GC Root构成了Root Set。
回收算法概述
- 引用计数法:当堆内存分配对象时,额外分配一个空间维护计数器,增加一个新的引用,则增加计数器,如果引用关系失效,则减少计数器。当计数器为0,则说明该对象已经被废弃,可以被回收。如果使用引用计数法,则有个循环依赖问题需要解决。
- 可达性分析法:将根集合做为起点,从这些节点开始向下搜索,搜索所走过的路径称为 引用链,当一个对象没有被任何引用链访问到时,则证明此对象是不活跃的,可以被回收。
jvm采用可达性分析法
- 垃圾回收算法
- 复制(copy)
- 复制算法可以使用多个分区,分区越多,利用率越大,例如,2个分区时,利用率为50%,3个分区时,利用率可以到66%
- 例如现在有3个分区 Eden,S0,S1
- 对象创建全部在Eden,S0,S1为空
- 第一次垃圾回收:Eden和S0的存活对象通过复制算法拷贝到S1
- 第二次垃圾回收:Eden和S1的存活对象通过复制算法拷贝到S0
- 2,3不断循环操作,所有新对象的创建全部在
- 缺点:堆的使用效率低 优点:吞吐量大,没有碎片,分配效率高
- 标记清除(Mark-Sweep)
- 从根集合出发,遍历对象,把活跃的对象入栈,依次处理。标记出活跃对象后,就可以把剩余的(不活跃的)对象清除。
- 缺点:内存碎片化 优点:无需移动对象,算法简单
- 标记压缩(Mark-Compact)
- 在完成标记清除的动作后,会把活跃对象从头开始重新排列,以减少内存碎片
- 缺点:stw时间更长,对缓存不友好(对象移动后顺序关系消失) 优点:堆的使用效率高,无内存碎片
- 复制(copy)
- 回收方法:
- 串行回收
- 使用单线程进行回收,mutator需要STW。通常新生代使用复制,老年代使用标记压缩。
- 并行回收
- 使用多线程进行回收,mutator需要STW。通常新生代使用复制,老年代使用标记压缩。(与串行回收不同在于,GC过程使用了多线程)
- 并发标记回收(CMS)
- 分为多个阶段
- 初始标记(STW)
- 并发标记
- 重新标记(STW)
- 并发清除
- 这个算法通常适用于老年代,新生代可以采用并行回收。
- 分为多个阶段
- 垃圾优先回收(Garbage-First G1)
- 从JDK7U4开始提供
- 分区分为
- 新生代分区
- 老年代分区:在任意时刻,只有部分老年代分区会被回收。这部分老年代分区会在下一次进行增量回收的时候同所有的新生代一起被回收(混合回收)。在选择老年代分区的时候,优先回收垃圾多的分区。
- 可用分区
- 大对象分区:对象大小超过一定的阈值之后,就不再进行复制操作(复制时间过长),直接将对象分配到老年代中。
- G1将堆拆成一些列的分区(Heap Region),GC操作只针对一部分分区,而不是整个堆或者老年代。
- 新老代的分区的内存块不再需要连续,可以互相转化。新生代是并行收集,采用复制算法。
- G1 会根据预测时间动态改变新生代大小。
- G1吸取了以下算法的优势:
- 列车算法:对内存进行分区
- CMS:并发标记回收
- 最老优先:最老的数据(越老的数据,是垃圾的可能性越高)优先收集。
- 串行回收
- 内存管理
- 分代管理:假定内存分为两个代:新生代和老年代
- 新生代:容易死亡的对象放在新生代,通常采用复制算法
- 老年代:把预期活的时间长的对象放在老年代,通常使用标记清除算法
- 缺点:复杂 优点:组合了算法,分配效率高,堆的使用率高
- 非分代管理
- 分代管理:假定内存分为两个代:新生代和老年代