原文地址:新浪博客 | zjdtc | 虚函数与构造函数、析构函数 | 2011-06-22
本文在原文之上,增加了些个人的问题及理解。
构造函数不能是虚函数
- 从存储空间角度
虚函数对应一个vtable,而这个vtable是存储在对象的内存空间的,也就是说,如果构造函数是虚函数,就需要通过vtable来调用,可对象就是通过构造函数来实例化的,实例化之前尚没有内存空间(衍生出“先有鸡还是先有蛋的问题”),所以构造函数不能是虚函数; - 从使用角度
虚函数主要用于在信息不全的情况下,能使重载的函数得到对应的调用,特别允许调用一个只知道接口而不知道其准确对象类型的函数;而构造函数本身就是要初始化对象,势必要知道对象的准确类型,所以构造函数不能是虚函数; - 从作用
虚函数的作用在于通过基类的指针或引用来调用它的时候能够变成调用派生类的那个成员函数,而构造函数是在创建对象时自动调用的,不可能通过基类的指针或者引用去调用,所以构造函数不能是虚函数; - 总结
vtable在构造函数调用后才建立,因而构造函数不可能成为虚函数;在调用构造函数时还不能确定对象的真实类型,因为派生类会调用基类的构造函数,而且构造函数的作用是提供初始化,在对象生命期只执行一次,不是对象的动态行为,也没有必要成为虚函数。
析构函数可以是虚函数,甚至是纯虚函数
在面向对象的编程过程中,基类的指针或引用通常会指向基类或派生类对象,如果基类的析构函数不是虚函数,在通过删除指针或引用来释放对象时,只会调用基类的析构函数,而不会调用派生类的析构函数,从而导致内存泄漏;反之,如果基类的析构函数是虚函数,就不会发生这类问题;因此,当一个类打算被用作其它类的基类时,它的析构函数必须是虚函数。考虑如下例子:
class A
{
public:
A() { ptra_ = new char[10];}
~A() { delete[] ptra_;} // 非虚析构函数
private:
char * ptra_;
};
class B: public A
{
public:
B() { ptrb_ = new char[20];}
~B() { delete[] ptrb_;}
private:
char * ptrb_;
};
void foo()
{
A * a = new B();
delete a;
}
在这个例子中,在执行delete a的时候,实际上只有A::~ A()被调用了,而B类的析构函数并没有被调用。如果将上面A::~A()改为virtual,就可以保证B:: ~B()也在delete a的时候被调用了;因此基类的析构函数都必须是virtual的;
但是,一般如果不做基类的类的析构函数一般不声明为虚函数,因为虚函数的实现要求对象携带额外的信息,添加系统开销,即需要在对象的内存空间中添加一个vptr,该指针指向vtable;
析构函数可以是纯虚函数,通常只有在将一个类设定为抽象类,而这个类又没有合适的函数可以被纯虚化的时候,可以使用纯虚的析构函数来达到目的;但是,纯虚的析构函数不同于其它纯虚函数的一点是,纯虚的析构函数要提供它的定义,其它的纯虚函数只提供声明即可,原因是:当释放一个派生类对象时,其析构函数调用最终会到抽象基类这一层,会调用抽象基类的虚构函数,如果抽象类的析构函数没有定义,会导致编译时错误。
多态与虚函数
虚函数是C++中用于实现多态的机制,核心理念就是通过基类访问派生类定义的函数。
多态的用途
在面向对象的编程中,首先会针对数据进行抽象(确定基类)和继承(确定派生类),构成类层次。这个类层次的使用者在使用它们的时候,如果仍然在需要基类的时候写针对基类的代码,在需要派生类的时候写针对派生类的代码,就等于类层次完全暴露在使用者面前。如果这个类层次有任何的改变(增加了新类),都需要使用者“知道”(针对新类写代码)。这样就增加了类层次与其使用者之间的耦合,有人把这种情况列为程序中的“bad smell”之一。多态可以使程序员脱离这种窘境,通过一个基类指针或引用,调用一个虚函数,可以达到实际调用不同派生类的函数的效果,降低了类层次与使用者之间的耦合。
如何“动态联编”
编译器是如何针对虚函数产生可以再运行时刻确定被调用函数的代码呢?也就是说,虚函数实际上是如何被编译器处理的呢?Lippman在深度探索C++对象模型[1]中的不同章节讲到了几种方式,这里把“标准的”方式简单介绍一下。
所说的“标准”方式,也就是“vtable”机制。编译器发现一个类中有被声明为virtual的函数,就会为其生成一个虚函数表,也就是vtable。vtable实际上是一个函数指针的数组,每个虚函数占用一个slot。一个类只有一个vtable,不管它有多少个对象。派生类有自己的vtable,但是派生类的vtable与基类的vtable有相同的函数排列顺序,同名的虚函数被放在两个数组的相同位置上。在创建类对象的时候,编译器还会在每个实例的内存布局中增加一个vptr字段,该字段指向本类的vtable。通过这些手段,编译器在看到一个虚函数调用的时候,就会将这个调用改写:
void bar(A * a){ a->foo(); }
会被改写为:
void bar(A * a){ (a->vptr[1])(); }
因为派生类和基类的foo()函数具有相同的vtable索引,而他们的vptr又指向不同的vtable,因此通过这样的方法可以在运行时刻决定调用哪个foo()函数。虽然实际情况远非这么简单,但是基本原理大致如此。
构造函数和析构函数中的虚函数调用
一个类的虚函数在它自己的构造函数和析构函数中被调用的时候,它们就变成普通函数了,不“虚”了。也就是说不能在构造函数和析构函数中让自己“多态”。
当构造函数内部有虚函数时,只调用自己类中的虚函数,原因是调用时还没有派生类版本的信息。
当析构函数内部有虚函数时,与构造函数相同,只有“局部”的版本被调用,原因是因为派生类版本的信息已经不可靠了。由于析构函数的调用顺序与构造函数相反,是从派生类的析构函数到基类的析构函数。当某个类的析构函数被调用时,派生自该类的类的析构函数已经被调用了,相应的数据也已丢失,如果再调用虚函数的最后一级的版本,就相当于对一些不可靠的数据进行操作,这是非常危险的。因此,在析构函数中,虚函数机制也是不起作用的。
什么时候使用虚函数
在你设计一个基类的时候,如果发现一个函数需要在派生类里有不同的表现,那么它就应该是虚的。从设计的角度讲,出现在基类中的虚函数是接口,出现在派生类中的虚函数是接口的具体实现。通过这样的方法,就可以将对象的行为抽象化。
Things to Remember
- 定义一个函数为虚函数,不代表函数为不被实现的函数;定义它为虚函数是为了允许用基类的指针来调用子类的这个函数;
- 定义一个函数为纯虚函数,才代表函数没有被实现;定义它是为了实现一个接口,起到一个规范的作用,规范继承这个,类的程序员必须实现这个函数;
- 有纯虚函数的类是不可能生成类对象的,如果没有纯虚函数则可以;
- 多态一般就是通过指向基类的指针来实现的。
问题:如果在基类中把某个函数声明为虚函数,在两个派生类中,一个再次定义该函数,另一个再将该函数声明为虚函数,两个派生类的虚函数表有什么不同?(答案见“参考文章”中的“C++虚函数表剖析”)