我们知道JVM内存结构也就是java程序时运行区,所以在了解之前首先对其思考:
- JVM内存结构都包含哪几部分,都是如何划分的?
- 每部分都是存储的什么数据?
- 真正运行时,一个对象创建的时候,是怎么分配的?
下面我们就以上面3个问题为引子,来了解JVM的内存结构。
一.JVM的内存结构
如下图所示:
可以看到,运行时数据区主要包含:方法区、堆、java栈、本地方法栈、程序计数器。其中方法区和堆是所有线程共享的,java栈、本地方法栈、程序计数器是线程私有的。
二、JVM结构分拆
1.程序计数器(Program Counter Register)
程序技术器是一块较小的内存空间,它可以看作是当前线程所执行的行号指示器。在任意时刻,一条 Java 虚拟机线程只会执行一个方法的代码,这个正在被线程执行的方法称为该线程的当前方法(Current Method)。如果这个方法不是 native 的,那 PC 寄存器就保存 Java 虚拟机正在执行的字节码指令的地址,如果该方法是 native 的,那 PC 寄存器的值是 undefined。PC 寄存器的容量至少应当能保存一个 returnAddress 类型的数据或者一个与平台相关的本地指针的值。此内存是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。
2.java虚拟机栈
与程序计数器一样,Java虚拟机栈也是线程私有的,它的生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型,每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用到执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
我们平时所说的基本变量在栈中分配,就是说的java栈,准确来说是说的局部变量表。
对于Java栈会出现一下2种异常情况:
- 如果线程请求的栈的深度大于虚拟机所允许的深度,将会抛出StackOverflowError异常;
- 如果 Java 虚拟机栈可以动态扩展,并且扩展的动作已经尝试过,但是目前无法申请到足够的内存去完成扩展,或者在建立新的线程时没有足够的内存去创建对应的虚拟机栈,那 Java 虚拟机将会抛出一个 OutOfMemoryError 异常。
3.本地方法栈
本地方法栈和虚拟机栈所发挥的作用非常相似,它们之间的区别是虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,本地方法栈为虚拟机使用到的Native方法(c或c++)服务。也会抛出StackOverflowError和OutOfMemoryError异常。
4.堆(Heap)
在 Java 虚拟机中,堆(Heap)是可供各条线程共享的运行时内存区域,也是供所有类实例和数组对象分配内存的区域。
Java堆是垃圾收集器管理的主要区域,所有又称为"GC堆"(Garbage Collected Heap)。
- Java堆的内部结构如下:
- Java堆由新生代(YoungGeneration)和老年代(OldGeneration)构成。年轻代又分为3部分:Eden(伊甸)区、From Survivor(幸存)区、To Survivor区,默认情况下年轻代按照8:1:1的比例来分配(-XX:SurvivorRatio)。
JVM控制参数:
- -Xms:JVM初始时堆内存大小
- -Xmx:JVM最大可用的堆内存大小
JVM也是一个软件,也必须要获取本机的物理内存,然后JVM会负责管理向操作系统申请到的内存资源。JVM启动的时候会向操作系统申请 -Xms 设置的内存,JVM启动后运行一段时间,如果发现内存空间不足,会再次向操作系统申请内存。JVM能够获取到的最大堆内存是-Xmx设置的值。
- -XX:MaxNewSize设置新生代最大空间大小。
- -XX:NewSize设置新生代最小空间大小。
没有直接设置老年代大小的参数,但可以计算出来:
老年代大小=堆内存大小-新生代大小
- -XX:MaxPermSize设置永久代最大空间大小。
- -XX:PermSize设置永久代最小空间大小。
- -XX:SurvivorRatio:设置新生代中1个Eden区与1个Survivor区的大小比值,默认设置8。如新生代的大小为100M,则Eden区大小为80M,2个Survivor区大小分别为10M。
- -Xss设置每个线程的堆栈大小。
- 如果实际所需的堆超过了自动内存管理系统能提供的最大容量,那 Java 虚拟机将会抛出一个OutOfMemoryError 异常。
5.方法区
方法区用于存储已被虚拟机加载的类信息、常量、静态变量、即使编译器编译或的代码等数据,所以它是线程共享的。虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做Non-Heap(非堆),目的应该是与Java堆区分开来。
a.类及其父类的全限定名(java.lang.Object没有父类)
b.类的类型(Class or Interface)
c.访问修饰符(public, abstract, final)
d.实现的接口的全限定名的列表
e.常量池
f.字段信息
g.方法信息
h.静态变量
i.ClassLoader引用
j.Class引用
对于习惯在HotSpot虚拟机上开发和部署程序的开发者来说,很多人愿意把方法区称为“永久代”(Permanent Generation),本质上两者并不等价,仅仅是因为HotSpot虚拟机的设计团队选择把GC分代收集扩展至方法区,或者说使用永久代来实现方法区而已。
Java虚拟机规范对这个区域的限制非常宽松,除了和Java堆一样不需要连续的内存和可以选择固定大小或者可扩展外,还可以选择不实现垃圾收集。相对而言,垃圾收集行为在这个区域是比较少出现的,但并非数据进入了方法区就如永久代的名字一样“永久”存在了。这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载,一般来说这个区域的回收“成绩”比较难以令人满意,尤其是类型的卸载,条件相当苛刻,但是这部分区域的回收确实是有必要的。
根据Java虚拟机规范的规定,当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。
永久代变更:
- jdk1.7 HotSpot已经字符串常量池从“永久代”移除到堆中,String.intern详解——参见深入理解String#intern
- jdk1.8中没有了永久代,替而代之的是:将方法区直接放在一个与堆不相连的本地内存区域,这个区域被叫做元空间(metaspace)——java8元空间
6.运行时常量池
运行时常量池是方法区的一部分,用于存放编译器生成的各种字面量和符号引用。
字面量:直接给值,不声明变量存储。例:int a = 3; 其中a是变量,3是字面量。
符号引用:在java中,一个java类将会编译成一个class文件。在编译时,java类并不知道引用类的实际内存地址,因此只能使用符号引用来(还不知道类的具体地址,使用能找到该类的一个类全限定名表示)代替。比如org.simple.People类引用org.simple.Tool类,在编译时People类并不知道Tool类的实际内存地址,因此只能使用符号org.simple.Tool(假设)来表示Tool类的地址。而在类装载器装载People类时,此时可以通过虚拟机获取Tool类 的实际内存地址,因此便可以既将符号org.simple.Tool替换为Tool类的实际内存地址,即直接引用地址。
根据Java虚拟机规范的规定,当常量池无法满足内存分配需求时,将抛出OutOfMemoryError异常。
7.直接(堆外)内存
直接内存并不是虚拟机运行数据去的一部分,也不是Java虚拟机规范中定义的内存区域,但是这部分内存也被频繁的使用,也会导致OutOfMemoryError异常。
在JDK 1.4中新加入了NIO(New Input/Output)类,引入了一种基于通道(Channel)与缓冲区(Buffer)的I/O方式,它可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆里面的DirectByteBuffer对象作为这块内存的引用进行操作。这样能在一些场景中显著提高性能,因为避免了在Java堆和Native堆中来回复制数据。——java堆外内存详解
三、对象访问定位
目前主流的访问对象的方式是使用句柄和直接指针,2中方式如下图所示。对于Sun HotSpot虚拟机来说,使用的直接指针访问对象。
2中使用方式比较:
方式 | 优势 |
---|---|
句柄访问 | reference中存储的是句柄的地址,在对象移动(如垃圾回收时移动对象)时只会改变句柄中实例数据的指针,而不会改变reference的值 |
直接指针访问 | 访问速度快,节省了一次指针定位的时间开销 |
四、对象创建
总结起来,创建对象分如下几步:
1、类加载检查。检查这个指令的参数是否能在常量池中定位到一个类的嘤嘤,并且检查这个富豪引用的类是否已经加载、解析、初始化,如果没有,则首先执行类加载;
2、分配内存。类加载完成后,类所需空间大小已确定。如果Java堆的内存是绝对规整的,则使用“指针碰撞”的方式进行分配;如果不是规整的,则是通过“空闲列表”来进行内存分配。