build流程
构建一次项目需要经历一些4个阶段
- 预处理
preprocess
读入头文件,展开宏 - 编译
生成汇编语言
, - 汇编
由汇编器assembler
转换为机器语言,生成.o
的目标文件 - 链接
将目标文件生成可执行文件.
第二个步骤的编译一般称之为狭义的编译,下面我们讨论的都是狭义的编译.好了,开始对编译阶段解析详细解析.
编译过程
狭义的编译大致大致分为4个阶段
- 语法分析
- 语义分析
- 生成中间代码
- 代码生成
语法分析
将代码进行解析,将其转换为计算机易于理解的形式,这里的解析(parse
)也成为语法分析(syntax analyzing
),解析代码的程序模块成为解析器(parser
)或语法分析器(syntax analyzer
).
最终会将代码转换成语法树的形式.
语义分析
通过解析代码获得语法树后,就要解析语法树,除去多余内容,添加必要信息,生成AST
抽象语法树.这个步骤成为语义分析.
语义分析包括一些处理
- 区分变量为局部变量还是全局变量
- 解析变量的声明和引用
- 变量和表达式的类型检查
- 检查在引用变量之前是否进行了初始化
- 检查函数是否按照定义返回了结果
语法分析只是将代码的构造照搬了过来,语义分析生成的AST
包含了语义信息.例如在变量引用和定义直接添加链接,适当增加类型转换等.
生成中间代码
生成AST
之后,将AST
转化为只在编译器内部使用的中间代码(IR
, Intermediate Representation
).
这样做是为了支持多种汇编语言或者机器语言.
代码生成
把中间代码转换成汇编语言,这个阶段称为代码生成(code generation
),负责此程序的模块称为代码生成器(code generator
).
优化
除了上述4个阶段外,现实编译器还包括优化(optimization
).
优化可以在编译器的各个环节进行.可以对AST
进行优化,可以对中间代码的代码进行优化,可以对转换后的机器语言进行优化.进一步来说,不仅是编译器,链接和运行时调用的程序库(library
)的代码也可以进行优化.