0
点赞
收藏
分享

微信扫一扫

预处理指令——一些比较少见的概念

年夜雪 04-02 08:30 阅读 3

         前言:预处理是我们的c语言源代码成为可执行程序的第一个步骤。而宏和预处理指令都是在这个阶段完成。本节内容就是关于宏和预处理指令相关知识点的解析。

目录

预定义符号

#define定义常量

#define定义符号

#define定义宏

带副作用的宏参数 

宏的替换规则

宏相对于函数的特点  

#和##

#

##

  命名约定

undef 

 命令行定义

条件编译 

头文件包含 

如何防止头文件被多次包含:


        

预定义符号

        在c语言之中, 定义了下面这几个宏定义符号。同样的, 因为预定义符号是宏, 它也是在预处理阶段进行处理。

#define定义常量

        #define可以定义常量, 具体做法如下

#include<iostream>
using namespace std;

#define MAX 10//定义常量
int main()
{
	for (int i = 0; i < MAX; i++) 
	{
		cout << i << endl;
	}

	return 0;
}

        这里就是#define定义常量, 常量值应该在常量名后边 。 

        #define定义常量的本质其实就是一种替换, 预处理阶段, 编译器会将源代码中的#define定义的常量进行替换。 什么意思?如下:

        现在我们还是看上面一串代码:

         当预处理之后, 这串代码就变成了:

#include<iostream>
using namespace std;

int main()
{
	for (int i = 0; i < 10; i++) 
	{
		cout << i << endl;
	}

	return 0;
}

        这里的MAX进行了替换。 

        既然#define定义常量的本质是完成替换, 那么在进行#define定义常量的时候需不需要在末尾加上分号?

        答案是不需要, 因为加上分号可能出现以下这种情况:

        这里就出现了一个问题, 当MAX被替换后, for的括号里变成了: “int i = 0; i < 10;;i++", 第二个判断条件和第三个变化条件之间有了两个分号, 相当于for括号里有了四条语句。这就出现了问题。所以, 当我们使用#define定义常量的时候, 不要再末尾加上分号!

        当然, 这里的常量也包括常量字符串

#include<iostream>
using namespace std;

#define STR "sdfsd"

int main() 
{

	cout << STR << endl;
	return 0;
}

#define定义符号

         #define也可以定义符号, 比如:


#include<iostream>
using namespace std;

#define FOR for(;;)

int main() 
{

	FOR;

	return 0;
}

        注意, 这串代码就是一个死循环。 因为FOR是#define定义的符号。 在预处理的时候, FOR被替换成了for(;;),这里面判断条件为空, 恒为真,所以就是一个死循环。 

        #define也可以定义一串很长的代码:

#include<iostream>
using namespace std;

#define MYFILE printf("name:%s, line:%s, data:%s",\
					__FILE__, __LINE__, __DATE__)
int main() 
{

	MYFILE;

	return 0;
}

 

        这个红色箭头指向的其实是续行符, 后面不能加空格, 否则续行符无效。续行符之后直接回车换行。 

#define定义宏

        什么是宏, 宏和上面的定义符号和定义常量有什么区别?

        同样的, 宏也是#define定义的一串代码, 但是它和上面的区别是宏是有参数的。定义宏的时候, 参数列表必须紧紧挨着宏名, 否则, 参数列表会被当成宏体。

        如下就是一个宏定义:

#include<iostream>
using namespace std;


#define ADD(x, y) x + y

int main() 
{
	int ret = ADD(1, 2);

	return 0;
}

        这个宏定义的工作原理是这样的, 首先1先传给x, 2传给y, 然后ADD参数列表的x, y的值传给宏体。 再完成替换。

        替换后就是这样的 

#include<iostream>
using namespace std;



int main() 
{
	int ret = 1 + 2;

	return 0;
}

         现在想一个问题。既然宏是在预处理阶段就完成替换, 那么他是不是比函数的速度快。 因为函数需要在运行的时候调用, 而宏是在预处理阶段就完成替换, 宏体的代码就在相应的位置展开了。

        答案是是的, 宏确实要比函数快。宏在预处理阶段直接完成替换, 不需要去建立栈帧消耗时间。而且, 宏的参数也没有类型:

        参数没有了类型, 就相当于没有了类型检查。 这样有好处也有缺点, 好处是参数没有了类型, 更加的灵活。 但缺点也是如此, 因为宏的参数没有了类型, 没有了类型检查, 代码就容易出现问题。 这说明了宏不易调试的缺点。

        这里说明宏也不全是优点, 他也是有缺点的。

        另外,宏还有另外一个不可忽视的缺点——优先级问题。 现在我们来看这么一串代码。 

#include<iostream>
using namespace std;


#define Mul(x, y) x * y

int main() 
{
	int ret = Mul(1 + 3, 2 + 3);

	return 0;
}

         这一串代码, 宏替换后是这样的: 1 + 3 * 2 + 3;

         这显然与我们的预期不符。如果这里是一个函数的话。 那么参数传送过去就应该是:4 * 5;这样的优先级问题可以成为内部的优先级问题。

        那么, 外部的优先级问题呢?


#include<iostream>
using namespace std;


#define ADD(x, y) x + y

int main() 
{
	int ret = ADD(1, 2) * 4;
	


	return 0;
}

         如图就是一个外部的优先级问题。 宏替换后代码是这样的: 1 + 2 * 4; 与我们的预期同样不符。我们的预期是这样的: 1 + 2 等于三, 然后3 * 4;

        所以, 这里也涉及到了优先级的问题。 

        我们要解决上面的问题, 那么定义的宏体就应该解决内部和外部的优先级问题。 可以这样定义:

#define ADD(x, y) ((x) + (y))

带副作用的宏参数 

        有一些表达式是有副作用的。 

        比如说++, --符号。 

int main() 
{
	int a = 0;
	int b = 1;
	int a = ++b;


	return 0;
}

        看这串代码, 前置++对于b来说就是有副作用的。 虽然给a赋值了一个b + 1, 但是b自身的值也发生了改变。 

        我们定义一个求最大值的宏:

#define MAX(x, y) x > y ? x : y

 在这个表达式中, 看似是没有问题的。 但是如果我们使用自增自减符号的时候就有问题。 

#include<iostream>
using namespace std;


#define MAX(x, y) x > y ? x : y
int main() 
{
	int a = 3;
	int b = 4;
	int ret = MAX(a++, b++);

	cout << a << endl;
	cout << b << endl;
	cout << ret << endl;

	return 0;
}

        这个参数是如何进行的呢

        其实, 替换之后应该是这样的:a++ > b++ ? a++ : b++;

        这里的a++和b++都出现了两份

        这里都是后置加加, a++ > b++这里是a的值3和b的值4进行比较。 比较完之后a加一编程4, b加一变成5。然后3 小于4, 执行b++, b的值进行返回, 返回的是五, 但是b此时还进行了一次++, 所以b变成了6. 所以ret为5, a为4, b为6.

         所以如果宏的参数在代码中不知出现一次, 而且宏的参数带有副作用。 那么代码就可能出现问题。 因为宏的参数不是计算之后再传进去, 而是直接进行替换。 

宏的替换规则

         1、在调用宏时, 首先对参数进行检查,看是否包含任何#define定义的符号。如果是, 首先        被替换。 如图:

#include<iostream>
using namespace std;


#define MAX(x, y) x > y
#define M 10

int main() 
{
	int a = 3;

	MAX(a, M);


	return 0;
}

         这里先进行替换的就是M, 将M替换为10之后再替换MAX, 替换后就是a > 10

        

         注意, 宏参数和#define定义中可以出现其他#define定义的符号, 但是宏不能出现递归。 宏不支持递归。

#include<iostream>
using namespace std;


#define MAX(x, y) x > y
#define M 10

int main() 
{
	int a = 3;
	

	MAX(a, MAX(a, 1));


	return 0;
}

        注, 这里并不会进行递归。 他只是将a和1先传参, 替换掉里面的宏定义。 然后得到的结果和a再进行传参, 替换掉外面的宏。

        并且, 字符串中的宏并不会被检测为宏。比如:

#include<iostream>
using namespace std;


#define MAX(x, y) x > y
#define M 10

int main() 
{
	int a = 3;
	
	const char* a = "dsfsM";


	return 0;
}

这里字符串中的M就不会被检测为宏, 不会被替换掉。

宏相对于函数的特点  

相比于函数, 宏的特点有这些:1、首先宏不能调试

                                                    2、宏不能进行递归

                                                    3、宏的速度很快, 它是直接代码替换,而不是在运行时建立栈帧。

                                                     4、宏的参数没有类型, 不会进行类型检查 

                                                     5、宏展开会增加代码长度。

                                                     6宏的参数可以出现类型, 但是函数做不到,例如:


#include<iostream>
using namespace std;
#include<stdlib.h>

#define Malloc(n, type) (type*)malloc(n * sizeof(type))

int main() 
{
	
	int* ptr = Malloc(1, int);

	return 0;
}

在这串代码中, 宏Malloc将1和int这个类型传过去, 但是函数一定做不到。 

#和##

#

        #运算符将宏的一个参数, 直接转化为字符串字面值。 它仅允许出现在待参数的宏的替换列表之中。

        #运算符所执行的操作符可以理解为”字符串化“。

意思就是说我们可以这样定义一个宏:


#include<iostream>
using namespace std;
#include<stdlib.h>

#define Print(a, format) printf("the value of " #a " is "format, a); 

int main() 
{
	
	int a = 10;
	Print(a, "%d");

	return 0;
}

 

        在这个宏中, #a预处理阶段会被转化为“a", #的作用就是这样, 将一个宏参数转变为字符串字面量形式。 

##

        ##可以把位于两边的符号变成一个符号。 但是这样的链接必须是合法的标识符, 否则结果就是未定义的。 

        

如图, 如果我们想要求处某个类型的最大值, 但是int类型和float的类型都要定义一个求取最大值函数。 这样就很麻烦, 这个时候如果我们定义这样的一个宏, 就可以解决问题。 

#define GEN_MAX(type)    \
	type type##_max(type x, type y)\
	{   \
		return x > y ? x : y ;\
	}

这个宏其实就可以生成一个函数。 而且type##_max中##将两边的链接, 其实就相当于是type_max。

假如我这里这样传参: 

红色箭头就相当于生成了两个函数。 

 这里我们使用这两个函数:

这其实就像模板一样。 

 
 命名约定

        一般我们宏都是定义为全大写, 不是宏不会定义为全大写。 但这些也不是一定的。 比如offsetof。        

        (offsetof 的作用是结构体成员相较于结构体其实位置的偏移量。)

undef 

undef的功能就是取消undef对应行之后的宏定义。

 命令行定义

        某些c语言编译器,允许在命令行进行定义符号。当我们要使用一个代码的不同版本的时候, 就可能用到这个命令行定义。 一些机器中大一些, 就可以开大一点的数组。 一些机器种小一些, 就可以开小一点的数组。

条件编译 

条件编译就是满足条件就进行编译, 如果不满足条件,就不要进行编译。 

比如if和endif的使用

#if 0

#define MAX 10

int main()
{
	printf("%d", MAX);
	
#undef MAX
	printf("%d", MAX);

	return 0;
}

#endif

这里面这一串代码在预处理阶段就会被销毁, 相当于被注释掉了。 

#if 1

#define MAX 10

int main()
{
	printf("%d", MAX);
	
#undef MAX
	printf("%d", MAX);

	return 0;
}

#endif

如果改成1就又会变回来。

 又或者if, elif, endif的使用

#define MAX 0


int main()
{

#if MAX == 0

	printf("%d", MAX);

#elif MAX != 0
	printf("%d", MAX);

	return 0;
}

#endif

根据MAX的值, 就会选择编译第一个打印还是第二个打印。

       

头文件包含 

        头文件的包含有两种形式。 一种是双引号“”的形式进行头文件包含。 一种是<>的形式进行头文件包含。 

        双引号的头文件包含形式,是先从原文件目录处寻找, 如果未找到头文件, 那么编译器就像查找库函数头文件一样在标准位置查找头文件。 如果再找不到, 那么就会报错。 

        标准头文件的路径, 再linux环境下, linux标准库的头文件是在/user/include/的路径底下。

        vs2022环境的标准头文件路径是略杂乱的。 一般它是在windowssdk路径之下,这里放的一般是贴近操作系统相关的头文件。 还有一些和c语言语法比较贴近的头文件, 放在了vs2022的路径底下。

        库文件直接去标准路径底下去查找, 如果找不到, 直接报错。

        为什么不让库文件也用“”包含呢?因为库文件是放在标准库里面的, 虽然库文件也可以使用“”进行包含, 但是这样效率就会变低,而且这样不容易区分本地文件和库文件了。

如何防止头文件被多次包含:

        当一个项目中文件数过多, 可能出现头文件重复包含的情况。 如何处理这种情况呢?有两种方法。

        一种就是#pragma once。其实这就是vs之中当我们创建一个头文件时自己加在第一行的一个函数。 

        另一种就是使用刚刚讲过的条件编译。

如图:

#ifndef __TEST_H__

#define __TEST_H__


//……代码

#endif 

        意思就是如过没有定义__TEST_H__, 那么第一行之后的代码就参与编译。 那么第一次我们包含头文件的时候就没有包含__TEST_H__。 这个时候他就会参与编译。然后__TEST_H__被定义。 那么下一次我们再进行这个头文件的包含的时候, 因为__TEST_H__已经被编译过了。 那么第一行代码就为假, 第一行以后的代码就不会被编译。 所以就实现了头文件只包含一次的情况。  

以上, 就是预处理指令的全部内容

举报

相关推荐

0 条评论