关于C++内部如何实现多态,对程序员来说即使不知道也没关系,但是如果你想加深对多态的理解,写出优秀的代码,那么这一节就具有重要的意义。 我们知道,函数调用实际上是执行函数体中的代码。函数体是内存中的一个代码段,函数名就表示该代码段的首地址,函数执行时就从这里开始。说得简单一点,就是必须要知道函数的入口地址,才能成功调用函数。
找到函数名对应的地址,然后将函数调用处用该地址替换,这称为函数绑定,或符号决议。
一般情况下,在编译期间(包括链接期间)就能完成符号决议,不用等到程序执行时再进行额外的操作,这称为静态绑定。如果编译期间不能完成符号决议,就必须在程序执行期间完成,这称为动态绑定。
非虚成员函数属于静态绑定:编译器在编译期间,根据指针(或对象)的类型完成了绑定。
而对于虚函数,知道指针的类型也无济于事。假设 func() 为虚函数,p 的类型为 A,那么 p->func() 可能调用 A 类的函数,也可能调用 B、C 类的函数,不能根据指针 p 的类型对函数重命名。也就是说,虚函数在编译期间无法绑定。
虚函数表 vtable
如果一个类包含了虚函数,那么在创建对象时会额外增加一张表,表中的每一项都是虚函数的入口地址。这张表就是虚函数表,也称为 vtable。 可以认为虚函数表是一个数组。 为了把对象和虚函数表关联起来,编译器会在对象中安插一个指针,指向虚函数表的起始位置。
例如对于下面的继承关系:
class A{
protected:
int a1;
int a2;
public:
virtual void display(){ cout<<"A::display()"<
virtual void clone(){ cout<<"A::clone()"<
};
class B: public A{
protected:
int b;
public:
virtual void display(){ cout<<"B::display()"<
virtual void init(){ cout<<"B::init()"<
};
class C: public B{
protected:
int c;
public:
virtual void display(){ cout<<"C::display()"<
virtual void execute(){ cout<<"C::execute()"<
};
各个类的内存分布如下所示:
通过上图可以发现,对于单继承,不管继承层次有多深,只需要增加一个指针即可,不会随着继承层次的加深让对象背负越来越多的指针。而且,基类中的虚函数在 vtable 中的索引是固定的,不会随着继承层次的增加而改变,例如 display() 的索引值始终是 0。当调用虚函数时,借助指针 vfptr 完成一次间接转换,就可以得到虚函数的入口地址。
对于虚函数 display(),它在 vtable 中的索引为 0,发生调用时:
p->display();
编译器内部会发生转换,产生类似下面的代码:
( *( p->vptr )[0] ) (p); //*( p->vptr )[0]是函数入口地址
这条语句没有用到与指针 p 的类型有关的信息,也没有用到 Name Mangling 算法。程序运行后会执行这条语句,完成函数的调用,这就是动态绑定。
编译器在编译期间会备足各种信息,并完成相应的转换,程序运行后只需要执行简单的代码就能找到函数入口地址,进而调用函数。
init() 函数在 vtable 中的索引为 2,发生调用时:
p->init();
编译器内部的转换为:
( *( p->vptr )[2] ) (p);
对于不同的虚函数,仅仅改变索引值即可。
当派生类有多重继承时,虚函数表的结构会变得复杂,尤其是有虚继承时,还会增加虚基类表,更加让人抓狂,这里我们就不分析了,有兴趣的读者可以自行研究。