0
点赞
收藏
分享

微信扫一扫

从离线到实时:无锡锡商银行基于 Apache Doris 的数据仓库演进实践

佃成成成成 2024-05-09 阅读 7

往期地址:

  • 操作系统系列一 —— 操作系统概述
  • 操作系统系列二 —— 进程
  • 操作系统系列三 —— 编译与链接关系
  • 操作系统系列四 —— 栈与函数调用关系
  • 操作系统系列五 —— 目标文件详解
  • 操作系统系列六 —— 详细解释【静态链接】
  • 操作系统系列七 —— 装载
  • 操作系统系列八 ——动态链接
  • 操作系统系列九 ——系统调用和API
  • 从编译角度看c和c++混合编译
  • stripped文件描述以及gdb反汇编工具使用
  • 操作系统的信号量操作以及实战中的踩坑分析

本期主题:
程序的汇编指令讲解


目录


1. x86-64的历史由来

下图是C语言类型在 x86-64位中的大小

C语言类型Intel数据类型汇编代码后缀大小(字节)
char字节b1
shortw2
int双字l4
long四字q8
char*四字q8
float单精度s4
double双精度l8

大多数gcc生成的汇编代码都有一个字符的后缀,表明操作数的大小。例如数据传输指令mov有四种变种:

  1. movb(传送字节)
  2. movw(传输字)
  3. movl(传输双字)
  4. movq(传输四字)

2. x86-64的寄存器信息

x86-64的机器代码和C语言代码相差非常大,C语言程序员比较关注的如下:

  • 程序计数器(通常也被称为"PC",在x86-64中用%rip来表示),表示将要执行的下一条指令在内存中的地址;
  • 通用目的寄存器,一个x86-64的中央处理器包含一组16个存储64位值的通用目的寄存器;
  • 栈指针寄存器,%rsp用来指明运行时栈的结束位置;
  • 帧指针寄存器,%rbp所直接指向的数据是调用该函数之前的rbp值,即可以认为是被调用函数的返回值

寄存器如下图:
在这里插入图片描述

3. 操作数指示符

大多数指令有一个或多个操作数(operand),指示出执行一个操作中要使用的源数据值,放置位置以及目的位置。

1. 寻址方式

根据操作数的可能性,将寻址方式分为三种类型:

  1. 立即数,用来表示常数值,例如 $1234,就是代表常数1234;
  2. 寄存器,表示某个寄存器的内容,我们用符号 r a r_a ra 来表示任意寄存器,用符号 R[ r a r_a ra] 来表示它的值;
  3. 内存引用,根据计算出来的地址访问某个内存位置;

寻址模式综合一下:
在这里插入图片描述

2. 数据传输指令

将数据从一个位置复制到另一个位置的指令。
MOV 指令的简单形式如下,代表着将数据从 S移动到D这个位置:

MOV S,D 

MOV指令由四条指令组成:movb、movw、movl、movq,对应着我们前面说的汇编指令后缀名的差异,其实主要差别在于操作数的大小不同

MOV操作指令有几个特点:

举例看下面的命令,实际上的意思就是将 0x4050这个数据,放在eax寄存器中

movl $0x4050, %eax

example 实例

看一个指针的具体例子
源码:

long exchange(long *xp, long y)
{
	long x = *xp;
	*xp = y;
	return x;
}

对应的反汇编代码,使用 objdump -d xxx 来进行反汇编:
在这里插入图片描述
对汇编代码进行解释:

// 前面讲过了,%rdi存的是第一个参数,%rsi 存的是第二个参数
// 在例子中具体具体就是  %rdi存的是xp这个指针,%rsi存的是y
// (%rdi),取出xp指针的值,即*xp
mov (%rdi),%rax , 把*xp赋值给返回值x
mov %rsi,(%rdi) , 把y赋值给*xp

从上面的汇编代码中可以看出两点:

3. 压入和弹出栈数据

栈是一种数据结构,可以添加或者删除值,遵循后进先出的原则。通过push把数据压入栈中,通过pop操作删除数据。
栈向下增长,栈顶元素的地址是所有栈中元素地址最低的。%rsp保存着栈顶元素的地址。

指令效果描述
pushq SR[%rsp] <- R[%rsp] - 8;
M[R[%rsp]] <- S
将四字压入栈
1. 先是取出%rsp寄存器的值,并减8,再给回%rsp寄存器;
2. 将S的值给到新的%rsp寄存器的值所指向的内容中
popq DD <- M[R[%rsp]] ;
R[%rsp] <- R[%rsp] + 8
将四字弹出栈
1. 先是取出%rsp寄存器的值,给到8;
2. 将%rsp寄存器+8

4. 加载有效地址 lea指令

加载有效地址(load effective address)指令lea实际上是mov指令的变形,它的指令形式是从内存读数据到寄存器。
与mov指令的差别在于:写入的目的操作数一定是寄存器

example

看一个例子,源码如下:

#include <stdio.h>
#include <stdlib.h>

long scale(long x, long y, long z)
{
	long t = x + 4 * y + 12 * z;

	return t;
}

注意使用gcc编译的时候,需要使用-Og,这样是为了防止编译器进行优化,导致结果对不上

gcc -Og -c main.c -o main_Og.o

使用objdump看结果:
在这里插入图片描述

举报

相关推荐

0 条评论