Java虚拟机编译
代码的编译是由javac编译器来完成的,编译器能将一种语言规范转换成另一种语言规范
javac将java语言编译诚字节码
Jvm将字节码转换成机器能识别的机器语言
javac表面看是将java文件转换成.class文件,实际是将java代码转换成一连串JVM可识别的二进制数字
- 过程
词法分析
读取源码,找出语言关键词,如if、else、while、等,识别哪些是不合法的词法分析的结果:就是从源代码中找出了一些规范化的token流,类似汉语中找茬错别字,经过这一步保证字都正确语法分析
分析token流,检查这些关键词组合在一起是不是符合java语言规范,如if后面是不是跟着一个boolean类型表达式。语法分析的结果是:形成符合java语言规范的抽象语法树,抽象语法树是一个结构化的语法表达形式,类似汉语中判断词对不对,经过这一步保证词的正确语义分析
把一些难懂的,复杂的语法转换成更简单的语法。语义分析结果:将复杂的语法转化为简单的语法,类似汉语中的名词解释,将成语翻译过来字节码生成
将会根据经过注释的抽象语法树生成字节码,也就是将一个数据结构转换成另外一个数据结构
JAVA内存管理和垃圾回收
jvm内存简介
可看作是java运行时内存区
java中垃圾回收一般是在java堆中进行,因为堆中几乎存放了java中所以的对象实例
对象引用
jdk1.2之后将引用分为4类:强引用
(Strong reference)、软引用
(sofe reference)、弱引用
(weak reference)、 虚引用
(phantom reference),强度依次减弱
- 强:
如:Person p=new Person()
,只要强引用还存在,垃圾收集器就永远不会回收掉被引用的对象 - 软:用来描述一些可能还有用,但并非必须的对象。系统内存不够用时,这类引用关联的对象将被垃圾回收器回收
- 弱:也是用来描述非需对象的,但强度比软引用更弱,被弱引用关联的对象只能生存在下一次垃圾收集前
- 虚:最弱的一种引用,完全不会对其生成实际构成影响,也无法通过虚引用来取得一个对象实例
一般很少使用弱引用与虚引用,使用软引用情况较多
内存溢出
在JVM申请内存的过程中,遇到无法申请到足够内存,从而导致内存溢出的情况。一般有以下几种情况:
虚拟机栈和本地方法栈溢出
StackOverflowError
: 线程请求的栈深度大于虚拟机所允许的最大深度(循环递归)
OutOfMemoryError
: 虚拟机在扩展栈是无法申请到足够的内存空间,一般可以通过不停地创建线程引起此种情况
Java堆溢出
: 当创建大量对象并且对象生命周期都很长的情况下,会引发OutOfMemoryError
运行时常量区溢出
:OutOfMemoryError:PermGen space,这里一个典型的例子就是String的intern方法,当大量字符串使用intern时,会触发此内存溢出
方法区溢出
:方法区存放Class等元数据信息,如果产生大量的类(使用cglib),那么就会引发此内存溢出,OutOfMemoryError:PermGen space,在使用Hibernate等框架时会容易引起此种情况。
垃圾对象的判定
判定对象是否为垃圾对象有如下算法:
引用计数算法:
给对象添加一个引用计数器,每当有一个地方引用它时,计数器值就加1,当引用失效时,计数器值就减1,任何时刻计数器都为0的对象就是不可能再被使用的。
实现简单,判定效率也很高
很难解决对象之间的相互循环引用问题
根搜索算法
Java采用根搜索算法来判定对象是否存活的。
基本思路是通过一系列名为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连时,就证明此对象是不可用的。
在Java语言里,可作为GC Roots的兑现包括下面几种:
虚拟机栈(栈帧中的本地变量表)中引用的对象。
方法区中的类静态属性引用的对象。
方法区中的常量引用的对象。
本地方法栈中JNI(Native方法)的引用对象。
垃圾收集算法
判定出垃圾对象之后,便可以进行垃圾回收了。
下面介绍一些垃圾收集算法
由于垃圾收集算法的实现涉及大量的程序细节,因此这里简要阐明各算法的实现思想
标记—清除算法
最基础的收集算法,分为“标记”和“清除”两个阶段
标记出所需回收的对象,在标记完成后统一回收掉所有被标记的对象,标记过程其实就是前面的根搜索算法中判定垃圾对象的标记过程。
缺点:
标记和清除过程的效率都不高。
产生大量不连续的内存碎片
复制算法
复制算法是针对标记—清除算法的缺点进行改进而得到的
内存按容量分为大小相等的两块,每次只使用其中的一块,当这一块的内存用完了,就将还存活着的对象复制到另外一块内存上面,然后再把已使用过的内存空间一次清理掉。
优点:
每次只对一块内存进行回收,运行高效。
只需移动栈顶指针,按顺序分配内存即可,实现简单。
内存回收时不用考虑内存碎片的出现。
缺点:
可一次性分配的最大内存缩小了一半。
标记—整理算法
标记与标记—清除算法中的标记过程一样
垃圾对象的处理情况有所不同,让所有的对象都向一端移动,然后直接清理掉端边界以外的内存。
分代收集
目前比较先进,当前商业虚拟机的垃圾收集都采用分代收集
根据对象的存活周期的不同将内存划分为几块,一般是把Java堆分为新生代和老年代。
重点放在新生代的收集,并且新生代只占整个空间很少一部分
新生代中,有大量对象死去,只有少量存活,选用复制算法
把新生代活很久的对象移动到老年代,老年代满了才去收集
新生代通常用复制算法
老年代中,对象存活率高、没有额外空间对它进行分配担保,使用标记—清除算法或标记—整理算法来进行回收。