0
点赞
收藏
分享

微信扫一扫

【C/C++内功心法】剖析编译链接的过程,探究源文件是如何一步步变成可执行程序,提升C/C++内功

晚熟的猫 2022-10-14 阅读 188

文章目录


前言


一、程序的翻译环境和执行环境

在ANSI C的任何一种实现中,存在两个不同的环境。


二、详解编译+链接

1.翻译环境

下面为程序编译的过程。


看代码:

test.c文件

#include<stdio.h>

// 想使用其他文件里面的函数需要先用extern声明一下。
extern int Add(int, int); 
extern int Sub(int, int);

int main()
{
	int a = 10;
	int b = 20;

	int c = Add(a, b); // 30
	printf("%d\n", c);

	int d = Sub(a, b); // -10
	printf("%d\n", d);

	return 0;
}

add.c文件

// 加法函数
int Add(int x, int y)
{
	return x + y;
}

sub.c文件

// 减法函数
int Sub(int x, int y)
{
	return x - y;
}

运行成功。


这是我们写的三个源文件。


我们在当前源文件路径下的Debug文件夹里面可以找到三个目标文件。


 我们在当前源文件路径下的Debug文件夹里面也可以找到最终的可执行程序。


我们刚刚演示的这些是在vs2019下进行的,而像vs2019这样的程序其实被称作 IDE(集成开发环境)


如果你去vs2019的安装路径下找一定能找到vs2019的编译器和链接器。


 2 编译本身也分为几个阶段


2.1 预编译(预处理)

在预处理阶段编译器会做以下几个动作

Linux下的命令。

我们将执行下面这三个命令,让编译器对这三个.c文件预处理完后就停下来。

命令1:gcc -E test.c -o test.i
命令2:gcc -E add.c -o add.i
命令3:gcc -E sub.c -o sub.i

预处理后,当前目录下就会出现三个.i文件。 


进入test.i文件。


验证头文件展开。

我们在 /usr/include 路径下可以看到有很多头文件,包括我们刚刚在test.c文件里面包含过的stdio.h文件。


进入stdio.h这个文件。


我们注意观察就可以发现test.i文件里面的增加内容基本上都是来自stdio.h文件。


 验证#define 定义符号的替换。

我们添加一行宏定义。


然后再对test.c文件进行预处理后,进入test.i文件观察。这时就可以观察到刚刚定义的Max被替换掉了。


 2.2 编译

在编译阶段编译器会做以下几个动作

Linux下的命令

我们将执行下面这三个命令,让编译器对这三个.i文件编译完后就停下来。

命令1:gcc -S test.i -o test.s
命令2:gcc -S add.i -o add.s
命令3:gcc -S sub.i -o sub.s

注意:这里的 -S 选项是大写的哦!

编译后,当前目录下就会出现三个.s文件。 


 进入test.s文件。


详解符号汇总

什么是符号?

  • 其实符号就是程序中的变量名、函数名
  • 就比如test.i文件里面的main、Add、Sub、printf都是符号,编译过程中编译器会将它们汇总起来,为后面的汇编和链接阶段做准备。(由于变量a、b、c、d都是局部变量,局部变量只有在当前作用域里才可以用,所以不用统计,一般汇总的符号都是全局的)
  • 在add.i文件里面可以汇总到符号Add
  • 在sub.i文件里面可以汇总到符号Sub
  • 在编译阶段看不出什么,符号汇总的作用主要体现在汇编和链接阶段,所以我们后面讲汇编和链接的时候会详细讲解。


2.3 汇编

在汇编阶段编译器会做以下几个动作

Linux下的命令


我们将执行下面这三个命令,让编译器对这三个.s文件汇编完后就停下来。

命令1:gcc -c test.s -o test.o
命令2:gcc -c add.s -o add.o
命令3:gcc -c sub.s -o sub.o

注意:这里的 -c 选项是小写的哦!

汇编完后,当前目录下就会出现三个.o文件。 


  进入test.o文件。


 详解符号表

查看test.o文件的符号表。

命令:readelf -s test.o

 我们可以看到test.o文件的符号表里面有main、Add、Sub、printf这些符号。


 查看add.o文件的符号表。

命令:readelf -s add.o

我们可以看到add.o文件的符号表里面有 Add 这个符号。


  查看sub.o文件的符号表。

命令:readelf -s sub.o

我们可以看到sub.o文件的符号表里面有 Sub 这个符号。


形成符号表

  • 我们在test.i文件里面汇总了Add、Sub、main这些符号。(由于printf是库函数,这里暂时先不考虑)

我们在编译过程中,test.i文件里面通过extern来声明了Add和Sub这两个函数,让编译器知道有这两个符号。


但是由于我们每个文件都是单独编译的,Add和Sub是定义在其他文件里面的,所以我们下面在调用Add和Sub函数的时候我们只知道有这2个函数,但是却找不到它们具体定义在哪里。


所以我们在形成符号表的时候只能给Add和Sub一个无效的地址(也就是随便给一个地址,因为我们找不到它们具体定义在哪)

由于main函数本身就是定义在当前test.o文件里面的,能够明确的找到它,所以我们可以给main一个有效的地址。


  •  我们在add.i文件里面汇总了Add这个符号。

由于Add函数本身就是定义在当前add.o文件里面的,能够明确的找到它,所以我们可以给Add一个有效的地址。


  • 我们在sub.i文件里面汇总了Sub这个符号。

由于Sub函数本身就是定义在当前sub.o文件里面的,能够明确的找到它,所以我们可以给Sub一个有效的地址。


3.链接 

在链接阶段编译器会做以下几个动作

3.1 合并段表


 3.2 符号表的合并与重定向。


 如果调用的函数没有定义(这里用vs2019演示了)

我们这里把加法函数注释掉,然后进行编译。


这时编译器就报错了:无法解析的外部符号 _Add,函数 _main 中引用了该符号。


 这是一个链接错误,因为我们将Add函数注释后,就找不到Add的有效地址了,所以编译器会报错。


总结

举报

相关推荐

0 条评论