作者 | 郑雨迪
出处 | 极客时间《深入拆解 Java 虚拟机》
下面这篇文章汇集了阿里、美团、Oracle 等大厂的 JVM 考点,你是否能回答得上来?
什么是 Java 虚拟机?为什么 Java 被称作是“平台无关的编程语言”?
Java 代码是怎么运行的?
Java 虚拟机是如何加载 Java 类的?
JVM 运行内存的分类
如何监控和诊断 JVM 堆内和堆外内存使用?
Java 四引用是什么?
如何理解 JVM 内置的编译或 GC 日志?
JVM 的永久代中会发生垃圾回收么?
Java 中的两种异常类型是什么?他们有什么区别?
JVM 是如何实现同步的?
Java 内在模型是什么?
即使编译器有哪些优化?
在什么情况下重复读写操作会被优化?
什么样的垃圾才被回收?
什么时候会导致垃圾回收?
如何利用 JFR 和 JMC 监控 Java 程序?
如何利用 Unsafe API 绕开 JVM 的控制?
如何利用字节码注入为已有代码加料?
……
我挑选了几个问题进行解答,希望能对大家面试起到帮助。
1、什么是 Java 虚拟机?为什么 Java 被称作是“平台无关的编程语言”?
Java 虚拟机是一个可以执行 Java 字节码的虚拟机进程。Java 源文件被编译成能被 Java 虚拟机执行的字节码文件。
Java 被设计成允许应用程序可以运行在任意的平台,而不需要程序员为每一个平台单独重写或者是重新编译。Java 虚拟机让这个变为可能,因为它知道底层硬件平台的指令长度和其他特性。
2、Java 代码是怎么运行的?
这个问题可以分三块来回答:
为什么 Java 要在虚拟机里运行?
Java 虚拟机具体是怎样运行 Java 字节码的?
Java 虚拟机的运行效率究竟是怎么样的?
Java 之所以要在虚拟机中运行,是因为它提供了可移植性。一旦 Java 代码被编译为 Java 字节码,便可以在不同平台上的 Java 虚拟机实现上运行。此外,虚拟机还提供了一个代码托管的环境,代替我们处理部分冗长而且容易出错的事务,例如内存管理。
Java 虚拟机将运行时内存区域划分为五个部分,分别为方法区、堆、PC 寄存器、Java 方法栈和本地方法栈。Java 程序编译而成的 class 文件,需要先加载至方法区中,方能在 Java 虚拟机中运行。
为了提高运行效率,标准 JDK 中的 HotSpot 虚拟机采用的是一种混合执行的策略。首先,它会解释执行 Java 字节码,然后会将其中反复执行的热点代码,以方法为单位进行即时编译,翻译成机器码后直接运行在底层硬件之上。HotSpot 装载了多个不同的即时编译器,以便在编译时间和生成代码的执行效率之间做取舍。
3、Java 虚拟机是如何加载 Java 类的?
Java 虚拟机将字节流转化为 Java 类的过程,可分为加载、链接以及初始化三大步骤。也可以用盖房子来类比 Java 虚拟机中的类加载。
加载是指查找字节流,并且据此创建类的过程。以盖房子为例,村里的 Tony 要盖个房子,那么按照流程他得先找个建筑师,跟他说想要设计一个房型,比如说“一房、一厅、四卫”。这里的房型相当于类,而建筑师,就相当于类加载器。村里有许多建筑师,他们等级森严,但有着共同的祖师爷,叫启动类加载器(boot class loader)。
加载需要借助类加载器,在 Java 虚拟机中,类加载器使用了双亲委派模型,即接收到加载请求时,会先将请求转发给父类加载器。
链接,是指将创建成的类合并至 Java 虚拟机中,使之能够执行的过程。链接还分验证、准备和解析三个阶段。其中,解析阶段为非必须的。
初始化,则是为标记为常量值的字段赋值,以及执行方法的过程。类的初始化仅会被执行一次,这个特性被用来实现单例的延迟初始化。这放在我们盖房子的例子中就是,只有当房子装修过后,Tony 才能真正地住进去。
4、如何监控和诊断 JVM 堆内和堆外内存使用?
了解 JVM 内存的方法有很多,具体能力范围也有区别,简单总结如下:
可以使用综合性的图形化工具,如 JConsole、VisualVM(注意,从 Oracle JDK 9 开始,VisualVM 已经不再包含在 JDK 安装包中)等。这些工具具体使用起来相对比较直观,直接连接到 Java 进程,然后就可以在图形化界面里掌握内存使用情况。以 JConsole 为例,其内存页面可以显示常见的堆内存和各种堆外部分使用状态。
也可以使用命令行工具进行运行时查询,如 jstat 和 jmap 等工具都提供了一些选项,可以查看堆、方法区等使用数据。
或者,也可以使用 jmap 等提供的命令,生成堆转储(Heap Dump)文件,然后利用 jhat 或 Eclipse MAT 等堆转储分析工具进行详细分析。
如果你使用的是 Tomcat、Weblogic 等 Java EE 服务器,这些服务器同样提供了内存管理相关的功能。
另外,从某种程度上来说,GC 日志等输出,同样包含着丰富的信息。
这里有一个相对特殊的部分,就是是堆外内存中的直接内存,前面的工具基本不适用,可以使用 JDK 自带的 Native Memory Tracking(NMT)特性,它会从 JVM 本地内存分配的角度进行解读。
5、JVM 的永久代中会发生垃圾回收么?
垃圾回收不会发生在永久代,如果永久代满了或者是超过了临界值,会触发完全垃圾回收 (Full GC)。如果你仔细查看垃圾收集器的输出信息,就会发现永久代也是被回收的。这就是为什么正确的永久代大小对避免 Full GC 是非常重要的原因。
(注:Java8 中已经移除了永久代,新加了一个叫做元数据区的 native 内存区)
6、在 Java 中,对象什么时候可以被垃圾回收?
当对象对当前使用这个对象的应用程序变得不可触及的时候,这个对象就可以被回收了。
7、Java 中的两种异常类型是什么?他们有什么区别?
Java 中有两种异常:受检查的 (checked) 异常和不受检查的 (unchecked) 异常。不受检查的异常不需要在方法或者是构造函数上声明,就算方法或者是构造函数的执行可能会抛出这样的异常,并且不受检查的异常可以传播到方法或者是构造函数的外面。相反,受检查的异常必须要用 throws 语句在方法或者是构造函数上声明。还有一些 Java 异常处理的小建议,我的专栏里都有提到。
8、JVM 垃圾回收算法
• 标记 - 清除算法:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
复制算法:将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当一块内存用完了,将还存另外一块上面,然后在把已使用过的内存空间一次清理掉。
标记 - 整理算法:标记过程与“标记 - 清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所一端移动,然后直接清理掉端边界以外的内存。
分代收集算法:一般是把 Java 堆分为新生代和老年代,根据各个年代的特点采用最适当的收集算法。新生代都发现有大批对象死去,选用复制算法。老年代中因为对象存活率高,必须使用“标记 - 清理”或“标记 - 整理”算法来进行回收。
JVM 知识框架图
再送大家一张我制作的 JVM 学习知识框架图,可作为你学习路上的指引。