开篇闲话:
王侯将相皆有封地,大小根据爵位高低而不同,等级森严。在计算机世界里,大boss(操作系统)很公平,给大家(进程)都分配了同样的内存大小(虽然这也是个假象)。我们的主角JVM出生的那天,大boss跟他说,你有4G的宅基地(内存空间)可以使用,让他好好想想怎么用,用的不好,年轻人,你将永无出头之日啊!
小主JVM虽然年纪小,但是思考的深度不亚于他的爸爸 James Gosling。把自家的一亩三分地管理地不仅秩序井然,还年年硕果累累。
预备知识:认识内存
1、内存是存放数据与指令的地方,cpu从缓存和内存中获取指令和数据执行程序。
2、JVM的内存区域是操作系统分配的一段内存空间,不能抛开计算机内存管理单看JVM的内存管理。(了解操作系统、cpu、主存、I/O设备如何运行与协作很重要,它能让你总揽全局而非以偏概全)
3、JVM屏蔽了各操作系统的指令集的区别,程序的数据和指令加载到内存中,通过JVM运行,最终也是通过JVM将这些指令转化为机器语言(比如汇编语言),由cpu中的运算器和寄存器等进行运算。
1、计算机内存模型
现在的计算机模型来自于冯·诺伊曼计算机结构,它解决了人类运算思维的机器实现和延展,可进行大量的复杂运算,同时也存在诸多的问题(比如数据同步的问题等)。内存在计算机中扮演的角色是指令和数据的存储,与cpu合作完成程序运行。假设需要计算1+1=?,内存中的状态可简化为:
①内存中存放程序指令MOVE[504]EAX(将地址为504处的内存值复制到寄存器EAX中)、MOVE[505]EBX、ADD EAX EBX(将寄存器中EAX和EBX中的值相加放在EBX);
②内存的每个存储单元存储的是指令还是值,由程序自己解析
2、内存的运行效率
类比厨师做菜,需要食材,食材可来源于超级市场、蔬果市场或者便利店,市场储藏的位置远近决定了厨师做出菜肴的效率。类似的,程序运行需要数据,程序的数据在文件、输入设备、内存、缓存中,各个设备的工作原理的差别,导致运行的效率区别天差地别:
cpu读取数据优先从缓存中读取(一级、二级、三级),如果没有就到内存中读取。如果cpu的延迟时间是1s,则内存的延迟为100-360s,速度很快。数据在缓存和内存中均不存在,需要从硬盘中读取,那就要等上1-12个月。内存很重要的一个职责就是做为硬盘的缓冲区,大大提升运行效率。
JVM内存模型及管理机制
1、运行时数据区
①程序计数器:
程序计数器(program counter register)是一块较小的存储空间,它是每个线程私有的内存区域,主要的作用是记住当前程序执行到哪条指令,以便在线程切换后可以准确的继续执行指令。
怎么记录呢,记录什么呢?其实很简单,就是记录指令的内存地址。
②java虚拟机栈
虚拟机栈属于线程私有,与线程同生共死。每当调用一个方法时,即在虚拟机栈中创建一个函数栈帧:
局部变量表:
1、存放编译期可知的各种基本类型(boolean,byte,char,short,int,long,float,double)、对象引用类型(指向对象地址起始位置的指针或代表对象的句柄);
2、存储的单元称为slot,大小为32位;
3、数组结构,通过索引访问;
4、局部变量表的空间大小(slot数量)在编译期便确定下来。
操作数栈:
1、被称为“基于栈的执行引擎”
2、操作数栈是执行字节码指令时,进行运算的单元;
3、数组结构,通过栈操作(压栈和出栈)来访问,下面的代码展示了0与1相加时操作数栈运行的字节码指令:
iload_0 // 将int类型的数字0压入栈中
iload_1 // 将int类型的1压入栈中
iadd // 将刚才压入的两个数字pop出去,相加,压入栈中
istore_2 // 将值pop到局部变量表中slot为2的地方
③方法区:
各个线程共享的内存区域,用于存储已经被加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
④方法区中的运行时常量池
java的Class文件中包含类的版本、字段、方法、接口等的描述信息,还有一项:常量池,用于存放编译期生成的字面量和符号引用。这部分内容将在类加载到方法区后,存放在方法区的运行时常量池。
运行时常量池的存在是因为常量池的内容是可以动态改变的,不仅仅是编译期确定的常量池内容。
⑤对象的内存布局
1、对象可不是我们平常画一个圆圈,标注“对象”两个字那么简单。它是用来存储运行时数据的地方;
2、对象分配的内存空间中主要包含三个部分:对象头、实例数据和对齐填充(包含的信息如图所示);
3、需要特别说明的是“实例数据”,这部分存储的是有效信息,就是在类代码中定义的字段内容(包含成员变量和局部变量,这是我个人的理解,待探讨),包含继承自父类的字段。
⑥如何找到对象
我们在函数栈帧中会用reference代表对象的类型,通过refrence来定位对象。在jvm规范中并没有明确定义reference,现在主流的实现方式有两种:
1、指针:reference指向堆中对象,指针指向方法区的对象类型数据;
2、句柄:堆中划分一片内存做为句柄池,reference存储的是对象的句柄地址,句柄中包含对象实例数据和类型数据的地址
最后,上张图,纵览一下全局: