2.1 被隐藏了的过程
- ide一般将编译和链接的过程一步完成,通常将这种编译和链接合并到一起的过程叫构建
- 从代码变成可执行文件,概括来说氛围4步:预处理、编译、汇编、链接
2.1.1 预编译
- 预编译过程主要处理那些“#”开始的预编译指令,规则如下
1."#define"删除,并展开所有的宏定义
2.处理所有的条件预编译指令,比如“#if”,“#ifdef”,“#elif”,“#else”,“#endif”
3.处理#include预编译指令,将包含的文件插入到该预编译指令的位置,这里过程会是递归进行,保证依赖的文件都会被加载进来
4.删除所有注释
5.添加行号以及文件名标识,ex:#2 ,以便编译时便一起产生调试用的行号信息,以及报错时显示行号
6.保留所有# 编译器指令,因为编译器需要使用它们
- 当无法判断宏定义是否正确或者头文件包含是否正确的时候,可以查看预编译后的文件来确定问题
2.1.2 编译
- 将预处理完成的文件进行一系列词法分析、语法分析、语义分析以及优化后生成的汇编代码
2.1.3 汇编
- 汇编器将汇编代码转变成机器可以执行的指令,每一个汇编语句机会对应一条机器指令
- 经过预编译、编译和汇编直接输出的事目标文件,.o形式
2.2 编译器做了什么
- 通俗理解是编译器将高级语言翻译成机器语言的一个工具
2.2.1 词法分析
- 源代码程序被输入到扫描器,扫描器只进行词法分析,利用算法(有限状态机的算法)将源代码的字符序列分割成一系列记号(token)
- 记号:关键字、标识符、字面量(包含数字、字符串等)和特殊符号(加号、等号),识别出来后将对应的token放对应的地方,ex:将标识符放符号表,将数字、字符串常量放文字表
2.2.2 语法分析
- 将扫描器产生的记号进行语法分析,从而形成语法树,可以认为每一个;间隔的会组成一个语法树
- 通俗理解为由语法分析器生成的语法树就是以表达式为节点的树
- 在形成语法树的时候,符号的优先级也被确定下来了
- 整个分析过程采用上下文无关语法,只针对一个分号进行分割,分析生成语法树
2.2.3 语义分析
- 语义分析,由语义分析器完成
- 编译器所能分析的语义是静态语义,即编译期可以确定的语义
- 动态语义:只有在运行期才能确定的语义
- 静态语义通常包括声明合类型的匹配,类型的额转换,要是发现类型不匹配,编译器会报错
- 经过语义分析,整个语法树的每一个节点都会标记类型
2.2.4 中间语言生成
- 有些编译期会在源代码级别进行优化
- 优化通常不会在语法树上进行优化,是将整个语法树转换为中间代码上进行优化,ex:4+6有的时候直接用10代替
- 中间代码可以理解为编译过程中的中间层,中间层之前的东西都是编译器前端完成,中间层之后的东西都是编译器后端完成
2.2.5 目标代码生成与优化
- 编译器后端主要包括代码生成器,目标代码优化器
- 编译过程:扫描代码-》语法分析-〉语义分析-》源代码优化-〉代码生成-》目标代码优化
- 现代的编译器可以将源代码文件编译成一个未链接的目标文件,然后由链接器将这些目标文件链接成可执行文件
2.3 链接器年龄比编译器长
- 当程序修改后,代码位置会被改动,这些位置都要重新计算,这种重新计算各个目标的地址过程叫重定位(在类似用纸记录二进制程序的时代)
- 为了解决重定位的重复计算问题,发明了汇编,可以用符号来标记位置,这样相对纸条编程,不用关心实际的代码位置
- 一个程序可以分为多个模块,模块之间的通信可以分为:函数调用和变量访问
- 函数调用需要知道目标函数的地址,变量访问也需要知道目标变量的地址,合在一起可以总结为模块间的符号引用
- 模块的拼接过程就叫链接
2.4 模块拼接--静态链接
- 人们把源代码模块独立编译,然后按规则组装,这个组装的过程叫链接
- 从原理上讲,链接的工作是把一些指令对其他符号地址的引用加以修正,a类用了b类中的函数进行调用,但是编译过程中并不知道b类中函数的地址,所以需要链接进行重定位之后,才能知道具体的地址
- 链接过程主要包括地址和空间分配,符号决议,重定位等
- 符号决议也叫符号绑定,地址绑定,