这篇文章源于美团面试官问的我一个问题,为什么Objective-C中有Class和MetaClass这种设计?去掉是否可以?当时的我并没有深入思考过这个问题,而网上搜索的结果都是在阐述有MetaClass而简略的解释了原因。我认为这个问题是个很关键的问题,花了大概两周时间查阅资料,查看源码。这篇文章试图展开探讨一个问题,为什么Objective-C中有MetaClass这个设计?
前置知识
首先简单分析下在Objective-C中,对象是什么。下面源码基于Runtime-709分析。
typedef struct objc_object *id;//id其实是一个object结构体的指针,所以id不用加*
typedef struct objc_class *Class;//Class是class结构体的指针
struct objc_object {
Class isa;
};
struct objc_class : objc_object {
Class superclass;
cache_t cache; // 用来缓存指针和虚函数表
class_data_bits_t bits; //方法列表等
//...
}
可以看到,对象最基本的就是有一个isa指针,指向他的class,而Class本身是继承自object。isa指针的理解诶就是英文is a,代表“xxx is a (class)”。那么也就是说,一个对象的isa指向哪个class,代表它是那个类的对象。那么对于class来说,它也是一个对象,它的isa指针指向什么呢?
对于Class来说,也就需要一个描述他的类,也就是“类的类”,而meta正是“关于某事自身的某事”的解释,所以MetaClass就因此而生了。
而从runtime动态生成一个类的Api的方法中,我们也可以发现metaClass的踪迹。
Class objc_allocateClassPair(Class superclass, const char *name,
size_t extraBytes)
{
Class cls, meta;
rwlock_writer_t lock(runtimeLock);
// 如果 Class 名字已存在或父类没有通过认证则创建失败
if (getClass(name) || !verifySuperclass(superclass, true/*rootOK*/)) {
return nil;
}
//分配空间
cls = alloc_class_for_subclass(superclass, extraBytes);
meta = alloc_class_for_subclass(superclass, extraBytes);
//构建meta和class的关系
objc_initializeClassPair_internal(superclass, name, cls, meta);
return cls;
}
通过这个方法生成后,就成了大家熟悉的那张图。
从这张图上,我们可以看到通过这么一层继承关系,Objective-C的对象原型继承链就完整了。
同时,实例的实例方法函数存在类结构体中,类方法函数存在metaclass结构体中,而Objective-C的方法调用(消息)就会根据对象去找isa指针指向的Class对象中的方法列表找到对应的方法。
Python中的MetaClass
再讲Objective-C之前,先讲讲别的语言的设计,通过各种语言的比较,可以从更广的层面去理解语言的设计思想。而之所以先讲起Python,是因为我在搜索MetaClass时,搜索结果中大部分其实是讲Python中MetaClass的。
先看看Python中一个对象结构是怎么样的,以下源码基于CPython 3.7.0 alpha 1。
//object.h
typedef struct _object {
_PyObject_HEAD_EXTRA
Py_ssize_t ob_refcnt;//引用计数
struct _typeobject *ob_type;//类型
} PyObject;
和Objective-C中类似,ob_type其实就是一个isa指针,代表是什么类型。
而再看看PyTypeObject是怎么样的。
//object.h
typedef struct _typeobject {
PyObject_VAR_HEAD
const char *tp_name; /* For printing, in format "<module>.<name>" */
Py_ssize_t tp_basicsize, tp_itemsize; /* For allocation */
//....
} PyTypeObject;
#define PyObject_VAR_HEAD PyVarObject ob_base;
typedef struct {
PyObject ob_base;
Py_ssize_t ob_size; //对象长度
} PyVarObject;
PyVarObject是一种可变长度对象,是在PyObject基础上加上了对象的长度。而开始的内存包括了ob_base这个PyObject,就代表可以用PyObject指针进行引用。所以可以说,结构体中刚开始的部分是一个PyObject对象,在Python中引用就是一个对象。那么PyTypeObject开头是一个PyVarObject,也就是一个对象。也就是说,Python里的Class,也是一个对象。
#在python中生成一个Class
MyClass = type('MyClass', (), {})
先看看Python里面的type关键字是什么。
//bltinmodule.c
SETBUILTIN("type", &PyType_Type);
//typeobject.c
PyTypeObject PyType_Type = {
PyVarObject_HEAD_INIT(&PyType_Type, 0)
"type", /* tp_name */
//.....
type_init, /* tp_init */
//....
type_new, /* tp_new */
//....
};
可以发现type关键字是PyType_Type的一个引用,而PyType_Type是返回一个PyTypeObject,生成类的对象。而PyVarObject_HEAD_INIT递归引用了自己(PyType_Type)作为它的type,所以可以得知type(class) == type
。也就是说,Python中类的isa指针指向type,也就说type其实就是MetaClass,而同时type(type) == type
,也就是type的isa指针指向type自身。那么Python的对象链就如下图。
而Objective-C不太一样的是,并不是每一个类都有一个MetaClass,而是所有的类默认都是同一个MetaClass。当然,Python里可以自定义新的MetaClass。
Python中为何要使用元类的原因可能是,Python希望让使用者对类有着最高的控制权,可以通过对元类的自定义而改变制造类的过程(例如Django里的ORM)。也就是,Python开放了面向对象中类的制造者的权限。而同时,根据StackOverFlow这个问答,Python的类的设计是借鉴于Smalltalk这门语言。
Smalltalk!!Objective-C的特性基本上是照搬的Smalltalk,看来Smalltalk里可以找到一些线索。
Smalltalk-面向对象的前辈
Smalltalk,被公认为历史上第二个面向对象的语言,其亮点是它的消息发送机制。
Smalltalk中的MetaClass的设计是Smalltalk-80加入的。而之前的Smalltalk-76,并不是每个类有一个MetaClass,而是所有类的isa指针都指向一个特殊的类,叫做Class
(这种设计之后也被Java借鉴了)。
而每个类都有自己MetaClass的设计,加入的原因是,因为Smalltalk里面,类是对象,而对象就可以响应消息,那么类的消息的响应的方法就应该由类的类去存储,而每个MetaClass就持有每个类的类方法。
问题1:每个MetaClass的isa指针指向什么?
如果MetaClass再有MetaClass,那么这个关系将无穷无尽。Smalltalk里的解决方案是,指向同一个叫MetaClass
的类。
问题2:MetaClass
的isa指针指向什么?
指向他的实例,也就是实例的isa指向MetaClass
,同时MetaClass
isa指向实例,相互指着。
那么Smalltalk的继承关系,其实和Objective-C的很像了(后面有class的是前者的MetaClass)。
这时候产生了一个重要的问题,假如去掉MetaClass,把类方法放到也类里面是否可行?
这个问题,我思索许久,发现其实是一个对面向对象的哲学思想问题,要对这个问题下结论,不得不重新讲讲面向对象。
从Smalltalk重新认识面向对象
以前谈到面向对象,总会提到,面向对象三特征:封装、继承、多态。但其实,面向对象中也分流派,如C++这种来自Simula的设计思想的,更注重的是类的划分,因为方法调用是静态的。而如Objective-C这种借鉴Smalltalk的,更注重的是消息传递,是动态响应消息。
而面向对象三种特征,更基于的是类的划分而提出的。
这两种思想最大的不同,我认为是自上而下和自下而上的思考方式。
- 类的划分,要求类的设计者是以一个很高的层次去设计这个类,提取出类的特性和本质,进行类的构建。知道类型才可以去发送消息给对象。
- 消息传递,要求的是类的设计者以消息为起点去构建类,也就是对外界的变化进行响应,而不关心自身的类型,设计接口。尝试理解消息,无法处理则进行特殊处理。
在此不讨论两种方式的优劣之分,而着重讲讲Smalltalk这种设计。
消息传递对于面向对象的设计,其实在于给出一种对消息的解决方案。而面向对象优点之一的复用,在这种设计里,更多在于复用解决方案,而不是单纯的类本身。这种思想就如设计组件一般,关心接口,关心组合而非类本身。其实之所以有MetaClass这种设计,我的理解并不是先有MetaClass,而是在万物都是对象的Smalltalk里,向对象发送消息的基本解决方案是统一的,希望复用的。而实例和类之间用的这一套通过isa指针指向的Class单例中存储方法列表和查询方法的解决方案的流程,是应该在类上复用的,而MetaClass就顺理成章出现罢了。
最后
回到一开始那个问题,为什么要设计MetaClass,去掉把类方法放到类里面行不行?
我的理解是,可以,但不Smalltalk。这样的设计是C++那种自上而下的设计方式,类方法也是类的一种特征描述。而Smalltalk的精髓正在于消息传递,复用消息传递才是根本目的,而MetaClass只不过是因此需要的一个工具罢了。
PS:笔者这个问题从MetaClass入手去思考,是百思不得其解的。后来看了很多面向对象的东西,才发现这不过是一个产物,而并不是一个重点。
PSS:对于类的实现,Javascript中那种使用Protocol实现的方式也很有意思,受限于篇幅,暂不展开
有任何问题欢迎评论私信或者提issue
QQ:757765420
Email:nemocdz@gmail.com
Github:Nemocdz
微博:@Nemocdz