对于初学者来说,Java虚拟机就像一堆高墙,它用内存动态分配和垃圾回收技术组成,隔离了Java和C的内存管理的工作。今天就来一探究竟,一起翻越这堵高墙。
起因
相信很多童鞋都是只在学校里学过C、C++,几乎没有接触过Java。在使用C系列编程的时候,开发人员不得不自己去做对象内存空间的申请和回收,我们拥有无限大的权限,我们可以是“皇帝”,也同样是每一个对象的“保姆”->负责每个对象的生命经常的全部。
Java的世界里,将这一切都屏蔽掉了,它底层使用一个叫虚拟机的东西自己实现了内存的管理。不用再写alloc 和 free 这样的函数了,不用日出现内存泄露的问题。这一切看起来那么美好,但是....正是因为这一切那么轻松,当真正出现内存泄露和溢出方面的问题的时候,如果我们不深入了解虚拟机是如何运作的、如果管理内存的,那么一切都变成灾难!
示意图
Java虚拟机在执行Java程序的过程中会把它管理的内存划分为若干个不同的数据区域。这些区域都有各自的用途,根据Java虚拟机规范的规定,虚拟机所管理内存会被分为如下图所示的几个区域:
接下来就让它们每个区域的区长上台介绍下自己~~~
程序计数器
区长:其实我的地盘是比较小的,其实大家可以把我看着是当前线程所执行的字节码的交通信号灯,负责控制每一条字节码指令的执行控制。我们这块区域是授权唯一不会抛出OutOfMemoryError异常的区域
!
字节码解释器工作时,其实就是通过改变信号灯的值来觉得下一个同行的是哪一条字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都会依赖这个计数器完成。
Java虚拟机的多线程内部是通过线程轮流切换并分配CPU执行时间的方式实现的,在任何一个确定的时刻,一个处理器都只会执行一个线程钟的指令。那么当线程切换后能恢复到上一次的位置,每个线程都需要一个独立的程序计数器,各个线程之间互不干扰,这类线程共享的内存区域称为“线程私有”内存。
更多内容:如果线程当前执行的是一个java方法,那么计数器记录的是正在执行的虚拟机字节码命令的地址;如果是native的方法,那计数器则为Undefined。
Java虚拟机栈
从示意图我们可以看出来,这块区域也是被划为线程私有
内存区域,当线程结束的时候,这块区域也就寿尽终寝啦。虚拟机栈其实描述的正是Java方法执行的内存模型:每个方法在执行的同事都会创建一个栈帧(Stack Frame)用于存储局部变量、操作数、动态链接、方法出口这些信息。每一个方法从调用->执行->返回的过程与栈帧在虚拟机栈中入栈到出栈的过程对应。
帧栈结构
局部变量表存放了编译器可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference类型,它不等同于对象本身,可能是指向一个代表对象的句柄或者其他与此对象相关的变量)和retureAddress类型。其中64位长度的long和double类型的数据会占2个局部变量空间,其余的数据类型只占1个。
局部变量表所需的内存空间是在编译期完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期不会改变局部变量表的大小。
规范中定义了两种异常:
- 如果线程的请求的栈深度大于虚拟机允许的深度,将会抛出StackOverflowError异常
- 如果虚拟机栈动态可扩展,当扩展到无法申请到足够内存时,就会抛出OutOfMemoryError异常
本地方法栈
这块内存区域和虚拟机栈非常相似,他们的区别从名字就可以看出来:Java虚拟机栈是用来执行Java方法的,而本地方法栈是用来执行Native方法的。
Sun HotSpot 合并了虚拟机栈和本地方法栈
Java堆
Java堆应该是虚拟机管辖范围内最大的一块内存区域。这块区域是被所有线程共享,在虚拟机一启动的时候就创建的,它的唯一目的就是存放对象实例,几乎所有对象的实例都需要到这里申请内存。
规范中描述:所有的对象实例以及数组都要在堆上分配,但是随着JIT编译器和逃逸分析技术的成熟,栈上分配、标量替换这些技术会导致一些微妙的变化,前面的“所有”会变得不那么绝对。
Java堆是垃圾回收期(GC)管理的主要区域,从内存回收的角度来看,现代的收集器都采用分代收集算法,所有这块区域又会细分为好几个区域:新生代、老年代;再细节的又会分为 Eden、From Survivor、To Survivor,下图展示了详细的区域:
从内存分配的角度来看,线程共享的Java堆中可能划分出多个线程私有的分配缓冲区。但是不管怎么划分,都与它存放的内容(对象实例)无关,都是为了更好地管理这块区域,进行内存回收、更快分配内存
。
规范中规定,Java堆的内存可以不保证空间连续,只需要保证逻辑连续即可。所以我们在实际生产中经常讲-Xmx和-Xms写成一致的,这样来减低因为动态扩展带来的不可预见情况
方法区
这块区域在java8中已经被换成元空间,详情见JAVA8:从永久区PermGen到元空间Metaspace
方法区和Java堆一样,都是所有线程共享的一块内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。另外它有一个别名叫着“永久代”,这是因为HotSpot虚拟机将GC分代收集扩展到了方法区,这样HotSpot的垃圾回收器就可以一同样的方式来管理这块内存。而这块区域会因为极少数情况(深入理解 Java String#intern() 内存模型)出现异常
运行时常量池
这部分也是方法区的一部分,Class文件中除了有类的版本号、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法去的运行时常量池中存放。
直接内存
这块区域在上面的示意图中看不到,是因为这块内存其实不受虚拟机管理,当时这部分内存过度使用,也会抛出OutOfMemoryError异常。
NIO中引入了一种基于通信和缓冲区的I/O方式,它可以使用Native的函数来直接分配Java堆外的内存,然后通过一个存储在Java堆中的一个DirectByteBuffer对象作为这块内存引用进行操作。所以在设置虚拟机堆大小的时候需要注意,如果使用了堆外内存需要考虑公式:堆内+堆外 < 总内存大小。目前市面上有很多的堆外工具,mapdb就是其中之一。应用比较多的是堆外缓存解决使用堆内缓存造成的fullgc频繁问题。
参考
--