第十章 早期(编译期)优化
目录:
10.1 对于编译器的概述
10.2 Javac编译器
10.3 妈妈,我想吃语法糖!
10.4 实战:插入式注解处理器
10.1 对于编译器的概述
Java语言的"编译期"是一段"不确定"的操作过程,因为它可能是指向一个前端编译器(编译器前端)把.java文件转变成.class文件的过程;也可能是指虚拟机的后端运行期编译器(例如JIT编译器,Just In Time Compiler)把字节码转变成机器码的过程;还可以能是指使用静态提前编译器(例如AOT编译器,Ahead Of Time Compiler)直接把*.java文件编译成本地机器代码的过程。
列举三类比较有代表性的编译器:
- 前端编译器:Sun的javac、EclipseJDT中的增量式编译器(ECJ)
- JIT编译器:HotSpot VM的C1、C2编译器
- AOT编译器:GNU Compiler for the Java (GCJ)、Excelsior JET
10.2 Javac编译器
10.2.1实现类:
com.sun.tools.javac.main.JavaCompiler的compile()和compile2()方法里。
10.2.2实现过程:
解析与填充符号表过程(Parse and Enter)
词法、语法分析
词法分析是将源代码的字符流转变为标记(Token)集合,单个字符是程序编写过程的最小元素,而标记则是编译过程的最小元素,关键字、变量名、字面量和运算符都可以成为标记。
语法分析是根据Token序列来构造抽象语法树的过程,它是一种用来描述程序代码语法结构的树形表示方式,语法树的每一个节点都代表着程序代码中的一个语法结构,例如包、类型、修饰符、运算符、接口、返回值甚至连代码注释等都可以是一个语法结构。该过程由类com.sun.tools.javac.parser.Parser来完成,产出的抽象语法树由com.sun.tools.javac.tree.JCTree类来表示
填充符号表的过程由com.sun.tools.javac.comp.Enter类实现。插入式注解处理器的注解处理过程(Annotation Processing)
JDK1.5之后,Java语言提供了对注解(Annotations)的支持,这些注解与普通的Java代码一样,是在运行期间发挥作用的。在JDK1.6中实现了JSR-269规范,提供了一组插入式注解处理器的标准API在编译期间对注解进行处理,我们可以把它看作是一组编译器的插件,在这些插件里面,可以读取、修改、添加抽象语法树中的任意元素。分析与字节码生成过程(Analyse and Generate)
语义分析 = 标注检查 + 数据及控制流分析
语法树能表示一个结构正确的源程序的抽象,但无法保证源程序是符合逻辑的,而语义分析的主要任务是结构上正确的源程序进行上下文有关性质的审查。
1.标注检查
标注检查步骤检查的内容包括诸如变量使用前是否已被声明、变量和赋值之间的数据类型是否能够匹配,并且还有一个重要动作叫做"常量折叠",例如
int a = 1 + 2
在语法树上可以看到字面量"1","2"和操作符"+"号,经过常量折叠之后,它们将会被折叠为字面量"3"
实现类为com.sun.tools.javac.comp.Attr和com.sun.tools.javac.comp.Check
2.数据及控制流分析
其作用是对程序上下文逻辑更进一步的验证,它可以检查出诸如程序局部变量在使用前是否有赋值、方法的每条路径是否都有返回值、是否所有的受查异常都被正确处理了等问题。
3.解语法糖(Syntactic Sugar)
指在计算机语言中添加的某种语法,这种语法对语言的功能并没有影响,但是更方便程序员使用。通常来说使用语法糖能够增加程序的可读性,从而减少程序代码出错的机会。
解语法糖的过程由desugar()方法触发,在com.sun.tools.javac.comp.TransTypes类和com.sun.tools.javac.comp.Lower类中完成
4.字节码生成
字节码生成是Javac编译过程的最后一个阶段,由类com.sun.tools.javac.jvm.Gen完成,字节码生成阶段不仅仅是把前面各个步骤所生成的信息(语法树、符号表)转化成字节码写到磁盘中,编译器还进行了少量的代码添加和转换工作。
10.3 Java语法糖
10.3.1 适用场景:
- 泛型:Java中的泛型表达只在源码中存在,在编译后的字节码文件中,就已经被替换为原来的原生类型了,并在相应的地方插入了强制转型代码,因此对于运行期的Java语言来说,ArrayList<int>与ArrayList<String>就是同一个类。这种实现方法成为"类型擦除"。
2.自动装箱和拆箱
调用Integer.valueOf()和Integer.intValue()
注意:
Integer a = new Integer(100);
Integer b = new Integer(100);
System.out.println(a == b) -> true
因为-128 < 100 > 127 ,可以理解成缓存中有打包过相同的值
Integer c = new Integer(200);
Integer d = new Integer(200);
System.out.println(c == d) -> false
200> 127 ,这个时候直接就创建了两个不同的Integer实例。
3.遍历循环
将foreach的遍历循环转换成了迭代器的实现,这也是为何遍历循环需要被遍历的类实现Iterable接口的原因。
4.变长参数
在调用时候变成了一个数组类型的参数
** 有关这几颗语法糖果,有代码为证 **
Java源码
package JVMLearning.tenChapter;
import java.util.Arrays;
import java.util.List;
/**
* Created by Max on 2016/9/17.
*/
public class SyntacticSugarTest {
public static void main(String[] args) {
List<Integer> list = Arrays.asList(1,2,3,4);
int sum = 0;
for (int i : list) {
sum += i;
}
System.out.println(sum);
}
}
经过反编译之后的源码:
package JVMLearning.tenChapter;
import java.io.PrintStream;
import java.util.Arrays;
import java.util.Iterator;
import java.util.List;
public class SyntacticSugarTest
{
public static void main(String[] args)
{
List<Integer> list = Arrays.asList(new Integer[] { Integer.valueOf(1), Integer.valueOf(2), Integer.valueOf(3), Integer.valueOf(4) });
int sum = 0;
for (Iterator localIterator = list.iterator(); localIterator.hasNext();)
{
int i = ((Integer)localIterator.next()).intValue();
sum += i;
}
System.out.println(sum);
}
}
将源码与反编译之后的源码对比可以看出,在进行初始化对泛型为Integer的List初始化的时候,调用了Integer.valueOf()方法,将基本类型int转换成了Integer,并且用数组来解决变长参数问题,在进行遍历循环的时候,将foreach语句变成了调用List的迭代器进行遍历。
5.条件编译
Java语言之中并没有使用预处理器,因为Java语言天然的编译方式(编译器并非一个一个编译java文件,而是将所有的编译单元的语法树顶级节点输入到待处理列表后再进行编译,因此各个文件之间能够互相提供符号信息)无序使用预处理器。
Java实现条件编译可以使用条件为变量的if语句
例如:
public static void main(String[] args) {
if (true) {
System.out.println("I'm first to go");
}
else {
System.out.println("oh,I'd like to know if i can go");
}
}
10.4实战:插入式注解处理器
根据插入式注解处理器提供的API来做一个简易的编译器,功能就是检测类、方法和字段的命名是否合乎规范,如果不合乎,就不提示WARNING信息
注解处理器需要继承javax.annotation.processing.AbstractProcessor,实现process()方法