当通过指针访问类的成员函数时:
- 如果该函数是非虚函数,那么编译器会根据指针的类型找到该函数;也就是说,指针是哪个类的类型就调用哪个类的函数。
- 如果该函数是虚函数,并且派生类有同名的函数遮蔽它,那么编译器会根据指针的指向找到该函数;也就是说,指针指向的对象属于哪个类就调用哪个类的函数。这就是多态。
编译器之所以能通过指针指向的对象找到虚函数,是因为在创建对象时额外地增加了虚函数表。
如果一个类包含了虚函数,那么在创建该类的对象时就会额外地增加一个数组,数组中的每一个元素都是虚函数的入口地址。不过数组和对象是分开存储的,为了将对象和数组关联起来,编译器还要在对象中安插一个指针,指向数组的起始位置。这里的数组就是虚函数表(Virtual function table),简写为vtable。
我们首先从代码角度,来验证一下上面的说明:
我们首先用VC6,写一段代码:
#include <iostream>
using namespace std;
//基类Base
class Base{
public:
int x;
void Test()
{
cout << "A" << endl;
}
};
//派生类Derived
class Derived: public Base{
public:
void Test()
{
cout <<"B" <<endl;
}
};
void Fun(Base *p)
{
p->Test(); //多态
}
void main()
{
Base a;
Derived b;
Fun(&b);
}
输出结果为:
B
如果将main函数中的Fun(&b);修改为Fun(&a);,那输出结果为:
A
因此验证了如果该函数是虚函数,并且派生类有同名的函数遮蔽它,那么编译器会根据指针的指向找到该函数;也就是说,指针指向的对象属于哪个类就调用哪个类的函数。
当我们去掉Base类中virtual void Test()的virtual,修改为void Test(),那无论传入的是&b还是&a,那输出结果都是
A
因此验证了如果该函数是非虚函数,那么编译器会根据指针的类型找到该函数;也就是说,指针是哪个类的类型就调用哪个类的函数。
现在我们分析下虚函数表:如果一个类包含了虚函数,那么在创建该类的对象时就会额外地增加一个数组,数组中的每一个元素都是虚函数的入口地址。不过数组和对象是分开存储的,为了将对象和数组关联起来,编译器还要在对象中安插一个指针,指向数组的起始位置。这里的数组就是虚函数表(Virtual function table),简写为vtable。
首先看一下,非虚函数和虚函数的调用在汇编角度有什么区别。
还是去掉Base类中virtual void Test()的virtual,修改为void Test(),然后跟进汇编:25: p->Test(); //多态
00401188 mov ecx,dword ptr [ebp+8]
0040118B call @ILT+75(Base::Test) (00401050) //在程序编译后,即将地址固化为00401050,即为Base::Test。
我们可以看到,在非虚函数的情况下,函数的调用是编译时绑定(编译时绑定是指在程序执行之前,由编译器和连接器确定方法调用的目标),也就是直接调用。
如果还原为以上的示例代码,即为原来的虚函数模式,然后跟进汇编:25: p->Test(); //多态
004011A8 mov eax,dword ptr [ebp+8]
004011AB mov edx,dword ptr [eax]
004011AD mov esi,esp
004011AF mov ecx,dword ptr [ebp+8]
004011B2 call dword ptr [edx] //程序编译后,地址为dword ptr [edx],[edx]是一个可变变量,即地址非固定。
我们可以看到,在虚函数的情况下,函数的调用是运行时绑定(运行时绑定是指在程序运行时,根据对象的实际类型确定方法调用的目标。运行时绑定也叫作动态绑定或后期绑定),也就是简间接调用。
这就是为什么虚函数能够调用派生类函数的在汇编层面的原因:虚函数是运行时绑定(也叫动态绑定或后期绑定)。
那我们继续分析上面的反汇编代码:
004011A8 mov eax,dword ptr [ebp+8] //使用[ebp+8]指定栈中存储的第1个参数,并将其读出到 eax 寄存器中。第一个参数为b对象的地址。
004011AB mov edx,dword ptr [eax] //将b对象的地址的第一个双字节的数值,读出到edx。这个数值就是虚函数表的的地址,
004011B2 call dword ptr [edx] //调用函数,函数地址即为虚函数表的第一个双字节值。
b对象的内存模型中,开始的第一个dword的值为虚函数表的地址;因为就一个虚函数,所以虚函数表的第一个dword的值就是这次调用的函数地址。 |