以简化的方式进行编译和链接
1.exe的执行
程序运行,只是从屏幕上不可能看到任何运行结果,因为,我们的程序根本没有向显示器输出任何信息。程序只是做了一些将数据送入寄存器和加法的操作,而这些事情,我们不可能从显示屏上看出来。程序执行完成后,返回,屏幕上再次出现操作系统的提示符
操作系统的外壳
操作系统是由多个功能模块组成的庞大、复杂的软件系统。任何通用的操作系统,都要提供一一个称为sel(外壳)的程序,用户(操作人员)使用这个程序来操作计算机系统进行工作。
DOS中有一个 程序command.com,这个程序在DOS中称为命令解释器,也就是DOS系统的shell.
DOS启动时,先完成其他重要的初始化工作,然后运行command com, command.com 运行后,执行完其他的相关任务后,在屏幕上显示出由当前盘符和当前路径组成的提示符,比如:“c:\” 或“c:windows"等,然后等待用户的输入。
用户可以输入所要执行的命令,比如,cd、 dir. type 等,这些命令由command执行,command 执行完这些命令后,再次显示由当前盘符和当前路径组成的提示符,等待用户的输入。
如果用户要执行一个程序, 则输入该程序的可执行文件的名称,command 首先根据文件名找到可执行文件,然后将这个可执行文件中的程序加载入内存,设置CS:IP指向程序的入口。此后,command 暂停运行,CPU运行程序。程序运行结束后,返回到command中,command再次显示由当前盘符和当前路径组成的提示符,等待用户的输入。
在DOS中,command处理各种输入:命令或要执行的程序的文件名。我们就是通过command来进行工作的。
汇编程序从写出到执行的过程
到此,完成了一个汇编程序从写出到执行的全部过程。我们经历了这样一个历程:
编程一1.asm→编译→1.obj-连接→1.exe→加载→内存中的程序一运行
程序过程的跟踪
现在我们知道,在DOS中运行一个程序的时候,是由command将程序从可执行文件中加载入内存,并使其得以执行。但是,这样我们不能逐条指令地看到程序的执行过程,因为command的程序加载,设置CS:IP指向程序的入口的操作是连续完成的,而当CS:IP指向程序的入口, command就放弃了CPU 的控制权, CPU立即开始运行程序, 直至程序结束。
为了观察程序的运行过程,可以使用Dcbug. Debug 可以将程序加载入内存,设置CS:IP指向程序的入口,但Debug 并不放弃对CPU的控制,这样,我们就可以使用Debug的相关命令来单步执行程序,查看每一条指令的执行结果。
[BX]和loop指令
[bx]和内存单元的描述
[bx]是什么呢?和10有些类似,[01表示内存单元,它的偏移地址是0. 比如在下面的指令中(在Debug中使用):
mov ax, [0]
将一个内存单元的内容送入ax,这个内存单元的长度为2字节(字单元),存放一个字,偏移地址为0,段地址在ds中。
mov al, [0]
将一个内存单元的内容送入al, 这个内存单元的长度为1字节(字节单元),存放一个字节,偏移地址为0,段地址在ds中。
要完整地描述一个内存单元,需要两种信息:1内存单元的地址:2内存单元的长度(类型)。
用[0]表示一个内存单元时,0表示单元的偏移地址,段地址默认在ds中,单元的长度(类型)可以由具体指令中的其他操作对象(比如说寄存器)指出。
[bx]同样也表示一个内存单元,它的偏移地址在bx中,比如下面的指令:
mov ax, [bx]
将一个内存单元的内容送入ax, 这个内存单元的长度为2字节(字单元),存放一个字,偏移地址在bx中,段地址在ds中。
mov al, [bx]
将一个内存单元的内容送入a1, 这个内存单元的长度为1字节(字节单元),存放一个字节,偏移地址在bx中,段地址在ds中。
loop英文单词“loop”有循环的含义,显然这个指令和循环有关
我们定义的描述性的符号:“()”
(ax)表示ax中的内容、(al)表示 al中的内容:
(20000H)表示内存20000H单元的内容(O中的内存单元的地址为物理地址);((ds)*16+(bx))表示:
ds中的内容为ADR1, bx中的内容为ADR2,内存ADR1X16+ADR2单元的内容。也可以理解为: ds中的ADRI作为段地址,bx中的ADR2作为偏移地址,内存ADR1:ADR2单元的内容。
注意,“()” 中的元素可以有3种类型:寄存器名:段寄存器名:内存单元的物理地址(一个 20位数据)。比如:
(ax)、(ds)、 (al)、 (ex)、 (20000H)、((ds)*16+(bx))等是正确的用法:
(2000:0)、((ds): 1000H)等是不正确的用法。
我们看一下(X)的应用,比如,
(1) ax 中的内容为0010H,可以这样来描述: (ax)= 0010H;
(2) 2000:1000 处的内容为0010H,可以这样来描述: (21000H)= 0010H;
(3)对于mov ax,[2]的功能,可以这样来描述: (ax)= ((ds)*16+2);
(4)对于mov [2],ax的功能,可以这样来描述: ((ds)*16+2)=(ax);
(5) 对于add ax,2的功能,可以这样来描述: (ax)=(ax)+2;
(6)对于add ax,bx的功能,可以这样来描述: (ax)=(ax)+(bx);
(7)对于push ax的功能,可以这样来描述:
(sp)=(sp)-2
((ss)*16+(sp))=(ax)
(8)对于pop ax的功能,可以这样来描述:
(ax)=((ss)*16+(sp))
(sp)=(sp)+2
“(X)”所表示的数据有两种类型:1字节;2字。是哪种类型由寄存器名或具体的运算决定,比如:
(a1)、(b1)、 (c1)等得到的数据为字节型; (ds)、 (ax)、 (bx)等 得到的数据为字型。
(a1)=(20000H),则(20000H)得 到的数据为字节型; (ax)=(20000H),则20000HD)得 到的数据为字型
约定符号idata表示常量
我们在Debug中写过类似的指令: mov ax,[0], 表示将ds:0 处的数据送入ax中。指令中,在“[...]”里用一个常量0表示内存单元的偏移地址。以后,我们用idata 表示常量。比如:
mov ax,[idata]就代表mov ax,[1]、mov ax,[2]、mov ax,[3]等。mov bx,idata就代表mov bx,1、mov bx,2、mov bx,3等。
mov ds,idata就代表movds,1、movds,2等,它们都是非法指令。