C++程序员光速入门汇编(三):虚函数表与虚函数调用

关键概念

下面会说到虚函数相关的一些重要细节。了解这些概念对于理解C++中的虚函数调用和动态类型检查非常重要。虽然这些细节在汇编层面不一定直接可见,但它们确实影响了编译器如何生成汇编代码来处理虚函数调用。

虚函数表的位置

虚函数表(vtable)是一个静态的数据结构,通常位于程序的数据段,由编译器生成,对C++程序员透明。每个具有虚函数的类都有一个与之关联的虚函数表。虚函数表中的每个条目都是一个指向虚函数实现的指针。派生类可以继承、重写或添加虚函数。当派生类继承基类的虚函数时,它们在虚函数表中具有相同的偏移量。当派生类重写虚函数时,它会在其虚函数表中用新的函数实现替换基类函数的指针。当派生类添加新的虚函数时,这些函数将被添加到虚函数表的末尾。

虚函数表指针的位置

每个具有虚函数的对象都有一个指向其类的虚函数表的指针。同样,虚函数表指针由编译器生成,对C++程序员透明。这个指针通常作为对象的第一个成员变量存储,位于对象内存布局的起始位置。在C++中,我们可以通过指向对象的指针来访问虚函数表指针。例如,如果pAnimal是一个指向Animal对象的指针,我们可以通过(void**pAnimal)[0]来访问其虚函数表的第一个条目。

虚函数地址在虚函数表中的位置和偏移

虚函数在虚函数表中的位置是由编译器决定的。通常,编译器会根据虚函数在类中的声明顺序来分配偏移量。假设有一个基类Animal,它具有两个虚函数:makeSound()eat()makeSound()的虚函数表偏移量可能是0,而eat()的偏移量可能是1。当一个派生类(如Dog)重写了makeSound()函数时,它的虚函数表中makeSound()的偏移量仍然是0,但指向了Dog::makeSound的实现。如果pAnimal是一个指向Animal对象的指针,我们可以通过(void**pAnimal)[1]访问eat函数在虚函数表中的条目。关于虚函数表和虚函数表指针的位置,以及虚函数地址在虚函数表中的位置和偏移,会在后续的MASM汇编代码有所体现。

同一个基类派生的子类的虚函数表是否共享

虚函数表不会在派生类之间共享。每个具有虚函数的类都有一个与之关联的虚函数表。虽然派生类可以继承、重写或添加虚函数,但是它们的虚函数表是不同的。在某些情况下,如果派生类没有重写任何虚函数,编译器可能会优化并共享虚函数表,但这取决于编译器的实现。

多继承和虚拟继承

虚拟继承和多继承可能会使虚函数调用变得更为复杂,因为编译器需要生成额外的代码来处理这些情况。在多继承的情况下,派生类从多个基类继承,因此会有多个虚函数表。派生类的对象将包含多个指向每个基类虚函数表的指针。虚函数表指针的布局和顺序取决于派生类继承基类的顺序。

在虚拟继承的情况下,虚拟基类将被放在对象内存布局的末尾。这意味着在虚拟继承的情况下,虚拟基类的虚函数表指针可能不位于派生类对象内存布局的起始位置。虚拟继承旨在解决菱形继承问题,即多个子类继承同一个基类,导致基类的多个实例被包含在最终的派生类中。虚拟继承确保所有派生类共享单个虚拟基类的实例,从而消除了菱形继承问题。

动态类型检查和dynamic_cast

在C++中,RTTI(Run-Time Type Information)会为包含虚函数的类提供运行时类型信息。当类具有虚函数时,编译器为类生成RTTI,这些信息可用于dynamic_casttypeid操作符。因此,在这种情况下,dynamic_cast可以用于安全地将基类指针转换为派生类指针。

然而,对于没有虚函数的类,编译器通常不会生成RTTI。这意味着在这种情况下,dynamic_cast不能用于类型转换,因为缺乏必要的运行时类型信息。如果你尝试对没有虚函数的类使用dynamic_cast,编译器会报错。这就是为什么我们需要使用static_cast进行类型转换。static_cast是在编译时进行的类型转换,它不依赖于RTTI。这意味着static_cast可以用于没有虚函数的类之间的类型转换。然而,这种转换是不安全的,因为它不会在运行时检查类型的兼容性。如果类型不匹配,可能会导致未定义行为。

虚析构函数

虚析构函数是一个特殊的虚函数,用于确保派生类对象在删除时能够正确地调用其析构函数。当通过基类指针删除派生类对象时,如果基类的析构函数不是虚函数,那么只有基类的析构函数会被调用。为了避免这种情况,我们需要将基类的析构函数声明为虚函数。这将确保在删除派生类对象时,适当的析构函数会被调用,从而正确地释放资源。在MASM汇编程序中,可以看到派生类的虚析构函数内部,调用基类的虚析构函数,完成整个析构过程。这将在后续的代码示例中得到体现。

程序示例

同样,下面会列出一段C++程序,以及可能生成的对应的MASM汇编程序。

#include <iostream>

class Base {
public:
    virtual void foo() {
        std::cout << "Base::foo()" << std::endl;
    }
    virtual ~Base() {
        std::cout << "Base destructor" << std::endl;
    }
};

class Derived : public Base {
public:
    void foo() override {
        std::cout << "Derived::foo()" << std::endl;
    }
    virtual ~Derived() {
        std::cout << "Derived destructor" << std::endl;
    }
};

int main() {
    Base *b = new Derived();
    b->foo();
    delete b;
    return 0;
}

该C++程序的输出将是:

Derived::foo()
Derived destructor
Base destructor

由于C++编译器会生成大量的汇编代码,包括一些库函数和系统调用,因此在这里只提供一个简化版的MASM汇编程序。这个简化版的汇编程序只包含虚函数调用和虚析构函数调用的关键部分。

; 省略其他导入和库函数声明

; 数据段定义
.data
    ; 虚函数表
    _vftable_Base   dd OFFSET _Base_foo, OFFSET _Base_destructor
    _vftable_Derived dd OFFSET _Derived_foo, OFFSET _Derived_destructor

; 代码段定义
.code
; 派生类的虚函数
_Derived_foo PROC
    ; 输出 "Derived::foo()"
    ; 省略具体实现
    ret
_Derived_foo ENDP

; 派生类的虚析构函数
_Derived_destructor PROC
    ; 输出 "Derived destructor"
    ; 省略具体实现

    ; 调用基类的析构函数
    call _Base_destructor

    ret
_Derived_destructor ENDP

; 基类的虚函数
_Base_foo PROC
    ; 输出 "Base::foo()"
    ; 省略具体实现
    ret
_Base_foo ENDP

; 基类的虚析构函数
_Base_destructor PROC
    ; 输出 "Base destructor"
    ; 省略具体实现
    ret
_Base_destructor ENDP

; 程序入口
_main PROC
    ; 创建派生类对象
    ; 省略具体实现

    ; 调用虚函数
    mov ecx, eax ; 将对象指针移到ecx寄存器
    mov eax, [eax] ; 获取虚函数表指针
    call dword ptr [eax] ; 调用虚函数(偏移为0)

    ; 删除对象
    mov eax, [ecx] ; 获取虚函数表指针
    call dword ptr [eax + 4] ; 调用相应的虚析构函数(偏移为4)

    ; 退出程序
    ; 省略具体实现
_main ENDP

END

数据段定义了两个虚函数表,一个是基类(_vftable_Base)的虚函数表,一个是派生类(_vftable_Derived)的虚函数表。虚函数表包含了类中虚函数的地址。C++程序编译为MASM汇编代码时,会显式地将所有虚函数表的地址定义在数据段中。

; 数据段定义
.data
    ; 虚函数表
    _vftable_Base   dd OFFSET _Base_foo, OFFSET _Base_destructor
    _vftable_Derived dd OFFSET _Derived_foo, OFFSET _Derived_destructor

派生类的虚函数和虚析构函数:_Derived_foo 和 _Derived_destructor 分别是派生类的虚函数和虚析构函数的实现。在虚析构函数中,我们调用基类的析构函数,确保资源得到正确释放。

; 派生类的虚函数
_Derived_foo PROC
    ; 输出 "Derived::foo()"
    ; 省略具体实现
    ret
_Derived_foo ENDP

; 派生类的虚析构函数
_Derived_destructor PROC
    ; 输出 "Derived destructor"
    ; 省略具体实现

    ; 调用基类的析构函数
    call _Base_destructor

    ret
_Derived_destructor ENDP

基类的虚函数和虚析构函数:_Base_foo 和 _Base_destructor 分别是基类的虚函数和虚析构函数的实现。

; 基类的虚函数
_Base_foo PROC
    ; 输出 "Base::foo()"
    ; 省略具体实现
    ret
_Base_foo ENDP

; 基类的虚析构函数
_Base_destructor PROC
    ; 输出 "Base destructor"
    ; 省略具体实现
    ret
_Base_destructor ENDP

_main 函数是程序的入口点。在这里,我们创建派生类对象、调用虚函数以及删除对象。重点分析一下调用虚函数和删除对象时调用虚析构函数的部分。

; 程序入口
_main PROC
    ; 创建派生类对象
    ; 省略具体实现

    ; 调用虚函数
    mov ecx, eax ; 将对象指针移到ecx寄存器
    mov eax, [eax] ; 获取虚函数表指针
    call dword ptr [eax] ; 调用虚函数(偏移为0)

    ; 删除对象
    mov eax, [ecx] ; 获取虚函数表指针
    call dword ptr [eax + 4] ; 调用相应的虚析构函数(偏移为4)

    ; 退出程序
    ; 省略具体实现
_main ENDP
  • 虚函数调用过程:
  1. 将对象指针移到ecx寄存器:mov ecx, eax
  2. 获取虚函数表指针:mov eax, [eax]
  3. 调用虚函数(偏移为0):call dword ptr [eax]

mov ecx, eax 的意义是将对象指针(this指针)放入 ecx 寄存器中。在这个示例中,eax 寄存器包含了对象指针(即 this 指针)。将它移动到 ecx 寄存器是为了后面调用析构函数时仍能使用该指针。在调用成员函数时,为了能够在成员函数中获取到this指针,一般都会进行这个过程,这对应了本系列第一篇文章中说到:ecx寄存器存储的很可能是this指针。

mov eax, [eax] 相当于一次指针解引用。在C++中,具有虚函数的类的对象内存布局中,第一个成员通常是一个指向虚函数表的指针。因此,当使用 mov eax, [eax] 时,我们实际上是对对象指针进行了一次解引用,从而获得了指向虚函数表的指针。
在汇编代码中,call dword ptr [eax] 这条指令用于调用虚函数。在这里,dword ptr 是一个操作数类型修饰符,表示接下来要访问的内存数据是一个双字(double word,32位)大小的数据。

call dword ptr [eax] 这条指令利用 eax 寄存器中的虚函数表指针调用虚函数。dword ptr 修饰符表示从内存中读取一个双字大小的数据(这里是虚函数的地址),然后 call 指令根据这个地址跳转到相应的函数并执行。这样我们就实现了虚函数的调用。

  • 虚析构函数调用过程:
  1. 获取虚函数表指针:mov eax, [ecx]
  2. 调用相应的虚析构函数(偏移为4):call dword ptr [eax + 4]

在析构函数调用过程中,同样需要先获取虚函数表指针。接着,根据虚函数表中的偏移量,调用相应的虚析构函数。在这个例子中,我们调用的是偏移为4的虚析构函数,即 Derived 类的析构函数。然后在派生类的虚析构函数内部,调用基类的虚析构函数,完成整个析构过程。

可以看到,虚函数调用和虚析构函数调用都是通过虚函数表来实现的。虚函数表是一个存储虚函数地址的数组,每个具有虚函数的类都有一个虚函数表。在运行时,对象的指针通过虚函数表来找到并调用对应的虚函数。这使得程序在运行时能够根据对象的实际类型调用正确的虚函数,实现了多态性。

总结

以上就是对虚函数表与虚函数调用过程的汇编层面分析。虽然上述示例能够阐述一些基本的原理和思想,但依旧建议读者使用Visual Studio等工具,将C++程序编译运行,并查看编译出的MASM代码,通过调试来理解虚函数的调用过程。为了减少非关键代码的生成,并能够通过断点调试,建议切换为Release模式编译,并将优化选项设置为已禁用(/Od)。这样编译出来的MASM汇编程序,理论上是比较契合示例程序中的汇编代码整体逻辑的,也方便打断点调试。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,126评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,254评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,445评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,185评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,178评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,970评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,276评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,927评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,400评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,883评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,997评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,646评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,213评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,204评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,423评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,423评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,722评论 2 345

推荐阅读更多精彩内容