前言
C语言中从源代码到二进制程序都经历了那些过程?
什么是gcc
gcc的全称是GNU Compiler Collection,它是一个能够编译多种语言的编译器。最开始gcc是作为C语言的编译器(GNU C Compiler),现在除了c语言,还支持C++、java、Pascal等语言。gcc支持多种硬件平台。
示例
预处理(Preprocessing)
预处理用于将所有#include头文件以及宏定义替换成其真正的内容,预处理之后得到的仍然是C代码文件,但是行数会变多。gcc的预处理是通过cpp预处理器来完成的,示例如下:
gcc -E hello.c -o hello.i
或者直接调用cpp命令
cpp hello.c -o hello.i
预处理过程
1.宏定义指令:将所有的#define删除,并且展开所有的宏定义
2.条件编译指令:处理所有的条件预编译指令,比如#if #ifdef #elif #else #endif等
3.头文件包含指令:处理#include 预编译指令,将被包含的文件插入到该预编译指令的位置
4.特殊符号指令:预编译器可研识别一些特殊的符号,例如:删除所有注释 “//”和”/* */”
5.添加行号和文件标识,以便编译时产生调试用的行号及编译错误警告行号
6.保留所有的#pragma编译器指令,因为编译器需要使用它们
编译(Compilation)
编译过程就是把预处理完的文件进行一系列的词法分析,语法分析,语义分析及优化后生成相应的汇编代码的过程
gcc -S hello.i -o hello.s
汇编(Assemble)
汇编过程将编译后的汇编代码转换成机器可以执行的命令,即机器码(machine code),每一个汇编语句几乎都对应一条机器指令。根据汇编指令和机器指令的对照表一一翻译即可,这一步会为每一个源文件产生一个文件叫做目标文件,是二进制格式。gcc汇编过程通过as命令完成,示例如下:
gcc -c hello.s -o hello.o
或者直接调用cpp命令
as hello.s -o hello.o
链接(Linking)
通过调用链接器ld将程序运行需要的一大堆目标文件,以及所依赖的其它库文件进行链接,最后生成可执行文件。 链接的核心是把各个模块之间相互引用的部分处理好,使得各个模块之间能够正确地衔接。链接又会根据链接对象静态库和动态库的不同,分为静态链接和动态链接。静态链接是在链接阶段把静态库加到可执行程序中的,相当于替换了引用。动态链接是在链接阶段只是加入引用,真正在程序运行的时候,系统动态加载动态库内容到内存中。
静态库和动态库都是二进制文件,存放了函数的实现,只是使用的方式不同。
gcc hello.o -o hello
结语(Linking)
经过以上分析,我们发现编译过程并不像想象的那么简单,而是要经过预处理、编译、汇编、链接。尽管我们平时使用gcc命令的时候没有关心中间结果,但每次程序的编译都少不了这几个步骤。也不用为上述繁琐过程而烦恼,因为你仍然可以:
gcc hello.c -o hello #编译
./hello #执行