CSAPP第三章

一、概述

计算机执行机器代码，用字节序列编码低级的操作，包括处理数据，管理内存，读写存储设备上的数据，以及网络通信。编译器基于编程语言的规则，目标机器的指令集和操作系遵循的惯例，经过一系列生成机器代码。本章中我们近距离观察机器代码，以及人类可以阅读的表示方式「汇编代码」。

二、高级语言和汇编

当我们使用高级语言的时候，机器屏蔽了细节，即机器级的实现。高级语言提供的抽象级别比较高，大多数时候这种抽象级别的工作效率会更高，也会更可靠。最大的优点是用高级语言编写程序可以在很多不同的机器上执行，而汇编是跟机器密切相关的。学习机器代码的意义，编译器承担了把高级语言生成汇编代码的工作，理解汇编代码可以尝试理解编译器的优化能力，并分析其中隐含的低效率。汇编代码非常接近于机器代码，与机器代码的二进制文件相比，汇编代码的主要特点是它用可读性更好的文本格式表示。能够理解汇编和原始C之间的联系，是理解计算机如何执行程序的关键一步。一些对C语言程序员隐藏的处理器状态都是可见的：

程序计数器：下一条指令在内存中的地址。

整数寄存器：包含8个命名的位置，可以存储一些地址或者整数的数据。有的用来记录某些重要的程序状态，有的则用来保存临时数据。

条件码寄存器：保存最近执行的算数或逻辑指令的状态信息，它们用来实现控制或数据流中的条件变化，比如用来实现 if 和 while 语句。

向量寄存器：存储浮点数。

三、程序编码以及数据格式

机器的抽象架构：

1）指令集架构：定义机器级程序的格式和行为，定义了处理器状态、指令的格式，以及每条指令对状态的影响。将程序的行为描述成好像每条指令都是按照顺序执行的。处理器的硬件远比描述的精细复杂，并发的执行很多命令，却能保证整体行为和指令集架构的顺序完全一致。

2）虚拟内存地址：提供的内存模型看上去像一个非常大的字节数组。

四、数据结构

由于计算机是由16位体系结构扩展为32位体系结构的，Intel 用术语 “字”(word) 表示16位数据类型，因此 32 位表示 “双字”（double words）,64 位数称为“四字”（quad words）。

前面的汇编代码我们可以看到所有的汇编指令都带有字母 l，比如movl、addl、subl、pushl等等，这个l的后缀其实就是表示的数据格式，表示我们操作的是32位的数值。

下面我们看一下 C 语言基本数据类型对应的 IA32 表示：

上面的图示很好理解，比如mov指令，它是一个数据传送的指令，那么movb就代表传送一个字节的数据，movw就代表传送两个字节的数据，而movl就代表传送四个字节的数据。需要注意的是，long long int在IA32架构中是不支持这种数据格式的。而且汇编代码使用后缀 “l” 来表示 4 字节整数和8字节双精度浮点数，这不会产生歧义，因为浮点数使用的是一组完全不同的指令和寄存器。

五、访问信息：操作数指示符和数据传送指令

一个 X86-64 的CPU包含一组 16 个存储 64 位值的通用目的寄存器，这些寄存器用来存储整数数据和指针。常见的程序中16个寄存器扮演着不同的角色，特别是栈指针用来指明运行时栈的结束位置。有的程序会明确读写这个寄存器。另外 15 个寄存器的用法更灵活，少量指令会使用某些特定的寄存器。更重要的是有一组编程规范控制着如何使用寄存器来管理栈、传递参数，从参数返回值，以及存储局部和临时数据。

1）操作数指示符

大多数指令都有一个或多个操作数（operand），指示出执行一个操作中要引用的源数据值，以及放置结果的目标位置。我们可以看出源数据值可以是常数形式给出，或者是从寄存器或存储器中读出。而结果可以存放在寄存器或存储器中。我们将不同的操作数分为如下三种类型：

①、立即数（immediate）：书写方式是$符号后跟一个标准C表示的整数，比如$52，$0x1F等等。任何能放进一个32位的字里面的数值都可以做立即数。

②、寄存器（register）:它表示某个寄存器的内容，可以是8个32位寄存器中的一个（比如%eax），也可以是8个16位寄存器中的一个（比如%ax）,还可以是8个单字节寄存器寄存器（比如%al）。上图是用Ea来表示任意寄存器a,用引用 R[Ea]来表示它的值。

③、存储器（memory）:它会根据计算出来的地址（通常称为有效地址）来访问某个存储器位置。我们将存储器看成一个很大的字节数组，用符号Mb[Addr] 表示对存储在存储器中从地址 Addr 开始的 b 个字节值的引用。上图省略了下方的 b。

从上图我们知道，第一行是立即数，第二行则是寄存器，剩下的全部是存储器。其中最后一行存储器语法 Imm(Eb,Ei,s)，表示的是最常用的形式，分为四个部分，

　　一、Imm 是立即偏移数

　　二、Eb 是基址寄存器

　　三、Ei 是变址寄存器

　　四、s 是比例因子，必须是 1、2、4或8

然后有效地址计算公式为： Imm + R[Eb]+R[Ei]*s。比如对于2(%esp,%eax,4)这个操作数来讲，它代表的是内存地址为2+%esp+4*%eax的存储器区域的值。

2）数据传送指令

数据传送指令：将数据从一个位置复制到另一个位置的指令。下图为最简单形式的数据传送指令MOV类：这些指令把数据从源位置复制到目的位置，不做任何变化。

源操作数指定的值是一个立即数，存储在寄存器中或者内存中。目的操作数指定一个位置，要么是一个寄存器，要么是一个内存地址。X86-64加了一条限制，传送指令的两个操作数不能都指向内存位置。将一个值从内存地址复制到另一个内存位置需要两条指令，第一条指令将源值加载到寄存器中，第二条将该寄存器值写入目的位置。

移动数据命令 MOVS 和 MOVZ：将较小的源值复制到较大的目的时使用。所有这些指令都把数据从源复制到目的寄存器。MOVZ类中的指令把目的中剩余的字节填充为0，而MOVS中的指令通过符号扩展来填充，把源操作的最高位进行复制。

3）压栈和弹栈

我们知道栈是一个数据结构，可以添加或删除值，遵循“后进先出”的原则。

push：把数据压入栈中，添加数据。

pop:把数据移出栈，删除数据。注意移出的值总是最近被压入而仍然在栈中的值。

栈可以实现为一个数组，总是从数组的一端插入或删除元素。而这一端称为栈顶，在 IA32 中，程序栈存放在存储器某个区域，如下图所示：

第三栏中说明的是在执行完 pushq 后立即执行命令 popq %rdx 的效果。先从内存中读取值0x123，然后写到寄存器 %rdx 中，然后寄存器 %rsp 的值将增加回到 0x108。如图所示，值0x123任然会保存在内存位置0x100中，直到被覆盖。无论如何，%rsp指向的地址总是栈顶。

六、总结

本篇主要讲解了汇编和机器级代码之间的关系。汇编能够让人更容易理解机器的行为。介绍了常见的汇编指令集操作。寄存器的种类和功能是需要慢慢感受的，至于使用方面，第一次阅读点到即止。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,968评论 6赞 482
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,601评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 153,220评论 0赞 344
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,416评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,425评论 5赞 374
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,144评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,432评论 3赞 401
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,088评论 0赞 261
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,586评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,028评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,137评论 1赞 334
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,783评论 4赞 324
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,343评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,333评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,559评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,595评论 2赞 355
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,901评论 2赞 345