JVM启动流程
JVM基本结构
1. PC寄存器 or 程序计数器(Program Counter Register)
- 是一块较小的内存空间,指向下一条指令的地址:分支、循环、跳转、异常处理、线程恢复等基本功能都需要依赖它来完成
- 执行本地方法时,PC的值为空(undefined)
- 每个线程拥有一个PC寄存器:在任何一个确定的时刻,一个处理器(内核)都只会执行一条线程中的指令
- 在线程创建时创建
2. Java虚拟机栈(Java Virtual Machine Stacks)
- 线程私有的(和PC寄存器一样)
- 每个Java方法在执行的同时都会创建一个栈帧(Stack Frame:方法运行时的基本数据结构):存储局部变量表、操作数栈、动态链接、方法返回地址等信息
- 每一个方法从调用直至执行完成:对应着一个栈帧在虚拟机中入栈到出栈的过程
- 局部变量表(Local Variable Table):存放了编译期可知的各种基本数据类型、对象引用和returnAddress类型(指向了一条字节码指令的地址),即,方法参数和方法内部定义的局部变量
- 64位长度的long和double数据会占用2个局部变量空间(slot),其余的数据类型只占用1个
- 局部变量表所需的内存空间在编译期间完成分配:一个方法需要在帧中分配多大的局部变量空间是完全确定的,运行期间不会改变局部变量表的大小
- 实例方法(非static的方法)的局部变量表中第0位索引的Slot默认是对此方法所属对象实例的引用,即,"this",余下的Slot则与static方法相同
- 操作数栈(Operand Stack):Java没有寄存器,所有参数传递使用操作数栈
- 后入先出
- 32位数据类型所占的栈容量为1,64位数据类型所占的栈容量为2
- 栈上分配
- 小对象(一般几十个bytes),在没有逃逸的情况下,可以直接分配在栈上
- 直接分配在栈上,可以自动回收,减轻GC压力
- 大对象或者逃逸对象无法栈上分配
3. Java堆(Java Heap)
- 被所有线程共享的一块内存区域,在虚拟机启动时创建:唯一目的就是存放对象实例
- 是GC管理的主要区域
- GC基本都采用分代收集算法:Java堆可以细分为新生代和老年代;再细致一点的有Eden空间、From Survivor空间、To Survivor空间等
- 可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可:主流的虚拟机都是按照大小可扩展来实现的
4. 方法区(Method Area)
- 各个线程共享的内存区域(与Java堆一样):存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据
- 在HotSpot虚拟机上,很多人把方法区称为“永久代”:两者并不等价,只是因为使用了永久代来实现方法区--这样更容易遇到内存溢出问题,放弃中,JDK 1.7已经把原本放在永久代的字符串常量池移出到堆中
5. 栈、堆、方法区交互
public class AppMain
//运行时, jvm把appmain的信息都放入方法区
{
public static void main(String[] args)
//main 方法本身放入方法区。
{
Sample test1 = new Sample("测试1");
//test1是引用,所以放到栈区里,Sample是自定义对象应该放到堆里面
Sample test2 = new Sample("测试2");
test1.printName();
test2.printName();
}
public class Sample
//运行时, jvm把Sample的信息都放入方法区
{
private name;
//new Sample实例后,name引用放入栈区里,name 对象放入堆里
public Sample(String name)
{
this.name =name;
}
//print方法本身放入方法区里。
public void printName()
{
System.out.println(name);
}
}
}
内存模型
Java内存模型的主要目标:定义程序中各个变量的访问规则,即,在虚拟机中将变量存储到内存和从内存中取出变量这样的底层细节
- 主内存(Main Memory):存储所有的变量
- 每条线程还有自己的工作内存(Working Memory):保存了被该线程使用到的变量的主内存副本拷贝,线程对变量的所有操作<读取、赋值等>都必须在工作内存中进行
- 数据从主内存复制到工作内存:必须按顺序执行read和load
- 由主内存执行的读(read)操作;
- 由工作内存执行的相应的加载(load)操作
- 数据从工作内存拷贝到主内存
- 由工作内存执行的存储(store)操作;
- 由主内存执行的相应的写(write)操作
- 每种操作都是原子的、不可再分的:lock unlock read load use assign store write
- 执行上述8种基本操作时必须满足如下规则:
- 不允许一个变量从主内存读取了但工作内存不接受;或者从工作内存发起回写了但主内存不接受
- 变量在工作内存中改变了之后必须把该变化同步回主内存
- 没有发生过assign操作时不允许把数据从线程的工作内存同步回主内存
- 对一个变量实施use、store操作之前,必须先执行过了assign和load操作
- 一个变量在同一个时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,多次执行lock后,只有执行湘通次数的unlock操作,变量才会被解锁
- 如果对一个变量执行lock操作,那将会清空工作内存中此变量的值,在执行引擎使用这个变量前,需要重新执行load或assign操作初始化变量的值
- 如果一个变量事先没有被lock锁定,那就不允许对它执行unlock,也不允许去unlock一个被其它线程锁定的变量
- 对一个变量执行unlock之前,必须先把此变量同步回主内存中(执行store、write操作)
- volatile关键字:Java虚拟机提供的最轻量级的同步机制
- 非正式但通俗易懂的作用介绍:当一个变量定义为volatile后,它将具备两种特性
-
保证此变量对所有线程的可见性(当一条线程修改了这个变量的值,新值对于其它线程来说是可以立即得知的):volatile变量在各个线程的工作内存中不存在一致性问题,但是Java里面的运算并非原子操作,导致volatile变量的运算在并发下一样是不安全的,只有在以下运算场景中才适合使用volatile变量,否则仍然要通过锁(synchronized或java.util.concurrent中的原子类)来保证原子性
- 运算结果并不依赖变量的当前值
- 变量不需要与其他的状态变量共同参与不变约束
- 禁止指令重排
-
保证此变量对所有线程的可见性(当一条线程修改了这个变量的值,新值对于其它线程来说是可以立即得知的):volatile变量在各个线程的工作内存中不存在一致性问题,但是Java里面的运算并非原子操作,导致volatile变量的运算在并发下一样是不安全的,只有在以下运算场景中才适合使用volatile变量,否则仍然要通过锁(synchronized或java.util.concurrent中的原子类)来保证原子性
- 选用volatile的意义--它能让我们的代码比使用其他的同步工具更快吗?
- 大多数场景下volatile的总开销比锁要低
- 在volatile与锁之中选择的唯一依据是volatile的语义能否满足使用场景的要求
- 非正式但通俗易懂的作用介绍:当一个变量定义为volatile后,它将具备两种特性
- 原子性、可见性与有序性:Java内存模型是围绕着在并发过程中如何处理原子性、可见性和有序性这3个特征来建立的
-
原子性(Atomicity)
- 基本数据类型的访问读写是具备原子性的
- 在synchronized块之间的操作也具备原子性
-
可见性(Visibility):当一个线程修改了共享变量的值,其他线程能够立即得知这个修改
- volatile
- synchronized:对一个变量执行unlock前,必须先把此变量同步回主内存中
- final:一旦初始化完成,其他线程就可见
-
有序性(Ordering):在本线程内,操作都是有序的;在线程外观察,操作都是无序的:“指令重排”或“工作内存与主内存同步延迟”)
- volatile
- synchronized:一个变量在同一个时刻只允许一条线程对其进行lock--持有同一个锁的两个同步块只能串行的进入
-
原子性(Atomicity)
- 先行发生原则(happens-before):判断数据是否存在竞争、线程是否安全的主要依据
- 程序顺序规则(Program Order Rule):一个线程内保证语义的串行性
- 锁规则(Monitor Lock Rule):解锁(unlock)必然发生在随后的对同一个锁的加锁(lock)前
- volatile规则(Volatile Variable Rule):对一个volatile变量的写,先发生于读
- 线程启动规则(Thread Start Rule):线程的start方法先于它的每一个动作
- 线程终止规则(Thread Termination Rule):线程的所有操作先于线程的终结(Thread.join())
- 线程中断规则(Thread Interruption Rule):线程的中断(interrupt())先于被中断线程的代码检测到中断事件的发生
- 对象终结规则(Finalizer Rule):对象的构造函数执行结束先于finalize()方法
- 传递性(Transitivity):A先于B,B先于C 那么A必然先于C
- 结论:一个操作“时间上的先发生”不代表这个操作会是“先行发生”;一个操作“先行发生”不能推导出这个操作必定是“时间上的先发生”
编译和解释运行的概念
- 解释运行
- 解释执行以解释方式运行字节码
- 解释执行的意思是:读一句执行一句
- 编译运行(JIT)
- 将字节码编译成机器码
- 直接执行机器码
- 运行时编译
- 编译后性能有数量级的提升
- 解释器与编译器两者各有优势:
- 当程序需要迅速启动和执行的时候,解释器可以首先发挥作用,省去编译的时间,立即执行
- 当程序运行后,随着时间的推移,编译器逐渐发挥作用,把越来越多的代码编译成本地代码之后,可以获取更高的执行效率