在实际开发中,有时候在编译之前还需要对源文件进行简单的处理。例如,我们希望自己的程序在Windows和Linux下都能够运行,那么就要在Windows下使用VS编译一遍,然后在Linux下使用GCC编译一遍。但是现在有个问题,程序中要实现的某个功能在VS和GCC下使用的函数不同(假设VS下使用 a(),GCC下使用 b()),VS下的函数在GCC下不能编译通过,GCC下的函数在VS下也不能编译通过,怎么办呢?
这就需要在编译之前先对源文件进行处理:如果检测到是VS,就保留 a() 删除 b();如果检测到是GCC,就保留 b() 删除 a()。
这些在编译之前对源文件进行简单加工的过程,就称为预处理(即预先处理、提前处理)
预处理指令是以#号开头的代码行,这种以#号开头的命令称为预处理命令。
#号必须是该行除了任何空白字符外的第一个字符。#后是指令关键字,在关键字和#号之间允许存在任意个数的空白字符,整行语句构成了一条预处理指令,该指令将在编译器对源程序正式编译之前由预处理程序完成的。例如#include等。预处理命令要放在所有函数之外,而且一般都放在源文件的前面。
C语言提供了多种预处理功能,如宏定义、文件包含、条件编译等使用预处理功能便于程序的修改、阅读、移植和调试,也便于实现模块化程序设计。
部分预处理指令:
1、文件包含 #include指令:
#include是文件包含命令,主要用来引入对应的头文件。#include的处理过程很简单,就是将头文件的内容插入到该命令所在的位置,从而把头文件和当前源文件连接成一个源文件,这与复制粘贴的效果相同。
#include有两种使用方式:
#include <stdio.h>
#include "myHeader.h"
使用尖括号< >和双引号" "的区别在于头文件的搜索路径不同,包含标准库的头文件建议用尖括号,包含自定义的头文件用双引号。一个#include命令只能包含一个头文件,多个头文件需要多个#include命令。
文件包含允许嵌套,也就是说在一个被包含的文件中又可以包含另一个文件。
2、宏定义 #define指令:
宏定义是由源程序中的宏定义命令#define完成的,宏代换是由预处理程序完成的。
宏定义的一般形式为:
#define 宏名 字符串
#表示这是一条预处理命令,所有的预处理命令都以#开头。
define是预处理命令。
宏名是标识符的一种,命名规则和标识符相同。
字符串可以是常数、表达式等。
宏定义是用一个标识符来表示一个字符串:
#include <stdio.h>
#define N 100
int main(){
int sum = 20 + N;
printf("%d\n", sum);//输出120
return 0;
}
#undef N //终止宏定义
void func(){
// Code
}
在编译预处理时,对程序中所有出现的“宏名”,都用宏定义中的字符串去代换,这称为“宏代换”或“宏展开”。
在源程序编译时,将先由预处理程序进行宏代换,即用(20+N)表达式去替换所有的宏名N,然后再进行编译。
对宏定义的几点说明
① 宏定义是用宏名来表示一个字符串,在宏展开时又以该字符串取代宏名,这只是一种简单的替换。字符串中可以含任何字符,可以是常数,也可以是表达式,预处理程序对它不作任何检查,如有错误,只能在编译已被宏展开后的源程序时发现。
② 宏定义不是说明或语句,在行末不必加分号,如加上分号则连分号也一起替换。
③ 宏定义必须写在函数之外,其作用域为宏定义命令起到源程序结束。如要终止其作用域可使用#undef命令。
④宏定义允许嵌套,在宏定义的字符串中可以使用已经定义的宏名,在宏展开时由预处理程序层层代换。例如:
⑤ 习惯上宏名用大写字母表示,以便于与变量区别。但也允许用小写字母。
⑥ 可用宏定义表示数据类型,使书写方便。例如:
#define UINT unsigned int
带参数的宏定义:
在带参宏定义中,不会为形式参数分配内存,因此不必指明数据类型。而在宏调用中,实参包含了具体的数据,要用它们去代换形参,因此必须指明数据类型。
这一点和函数是不同的:在函数中,形参和实参是两个不同的变量,都有自己的作用域,调用时要把实参的值传递给形参;而在带参数的宏中,只是符号的替换,不存在值传递的问题。
因此结果是正确的。如果去掉括号,把程序改为以下形式:
#include <stdio.h>
#define SQ(y) y*y //宏定义
int main() {
int a, sq;
printf("input a number: ");
scanf("%d", &a); //输入9
sq = SQ(a+1);
printf("sq=%d\n", sq); //输出19,非100
return 0;
}
宏替换后将得到以下语句:
sq =SQ(a+1) =a+1*a+1 = 19; //注意宏定义只是符号替换,这是不同于函数传值的。
为了获取正确值需要这样声明宏:#define SQ(y) (y)*(y)。此时sq = SQ(a+1) = (a+1)*(a+1) = 100
有时带参宏定义不仅要在参数两侧加括号,还应该在整个字符串外加括号。
#include <stdio.h>
#define SQ(y) (y)*(y)
int main() {
int a,sq;
printf("input a number: ");
scanf("%d", &a); //输入9
sq = 200 / SQ(a+1); //输出200,并非2
printf("sq=%d\n", sq);
return 0;
}
宏替换后将得到以下语句:
sq =200 / SQ(a+1) = 200/(a+1)*(a-1) = 200
为了获取正确值需要这样声明宏:#define SQ(y) ((y)*(y))。此时sq = 200/((a+1)*(a+1)) = 2
#define和typedef的区别
#define宏定义只是简单的字符串代换,是在预处理完成的;
typedef是在编译时处理的,它不是作简单的代换,而是对类型说明符重新命名。被命名的标识符具有类型定义说明的功能。
请看下面的例子:
#define PIN1 int *
typedef (int *) PIN2;
下面用PIN1,PIN2说明变量时就可以看出它们的区别:
PIN1 a,b;
在宏代换后变成:
int *a,b; //表示a是指向整型的指针变量,而b是整型变量
PIN2 a,b;
转换后表示:
int *a,int*b //表示a、b都是指向整型的指针变量。因为PIN2是一个类型说明符。
3、条件编译指令:
这种能够根据不同情况编译不同代码、产生不同目标文件的机制,称为条件编译。条件编译是预处理程序的功能,不是编译器的功能。
假如现在要开发一个C语言程序,让它输出红色的文字,并且要求跨平台,在 Windows 和 Linux 下都能运行
这个程序的难点在于,不同平台下控制文字颜色的代码不一样,我们必须要能够识别出不同的平台。
Windows 有专有的宏_WIN32,Linux 有专有的宏__linux__,以现有的知识
#include <stdio.h>
int main(){
#if _WIN32
system("color 0c");
printf("http://c.biancheng.net\n");
#elif__linux__
printf("\033[22;31mhttp://c.biancheng.net\n\033[22;30m");
#else
printf("http://c.biancheng.net\n");
#endif
return 0;
}
注:直接用if、else会报错,因为Windows 下提示 __linux__ 是未定义的标识符,在 Linux 下提示 _Win32 是未定义的标识符。
#if、#elif、#else 和 #endif 都是预处理命令,整段代码的意思是:
如果宏 _WIN32 的值为真,就保留第 4、5 行代码,删除第 7、9 行代码;如果宏 __linux__ 的值为真,就保留第 7 行代码;
如果所有的宏都为假,就保留第 9 行代码。#endif是结束符。
这些操作都是在预处理阶段完成的,多余的代码以及所有的宏都不会参与编译,不仅保证了代码的正确性,还减小了编译后文件的体积。
#ifdef指令 。在判断某个宏是否被定义是使用#ifdef指令,通常和#endif一起使用。
#include <stdio.h>
#define DEBUG
void main(){
int i=1;
#ifdef DEBUG //判断宏DEBUG是否被定义
printf("i = %d\n",i); // 如果宏DEBUG被定义则编译输出i
#endif //结束符
}
#ifndef指令 。和#ifdef相反,如果宏没有被定义则编译#ifndef到#endif中间内容。
需要注意的是
#if 命令要求判断条件为“整型常量表达式”,也就是说,表达式中不能包含变量,而且结果必须是整数;
if 后面的表达式没有限制,只要符合语法就行。这是 #if 和 if 的一个重要区别。
#ifdef 和 #ifndef 后面跟的只能是一个宏名,不能是其他的。