浅析 Python slots

上一篇翻译了一篇Python中使用__slots__达到节省内存的方法，今天就看一下Python内部是怎么实现__slots__这个功能的。
>>> class A(object):
... slots = ["v"]
...
>>> a = A()
>>> a.v = 1
>>> a.b = 1
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'A' object has no attribute 'b'
>>> type(A.v)
<type 'member_descriptor'>

上面这一段代码，Class A声明了__slots__参数，对实例a的v变量进行赋值没有问题，但对实例a的b变量赋值，则会有个AttributeError的异常发生。再仔细看看A.v，原来他是一个descriptor(有时间可以写一篇Python descriptor相关的文章，Python中很多功能的实现都离不开descriptor)！
那么，Python在构建Class A的时候到底都做了什么，我们慢慢地解析下去。

Class A的创建

Python中类的构建的相关字节码是BUILD_CLASS:

  # in ceval.c
  case BUILD_CLASS:
        u = TOP();
        v = SECOND();
        w = THIRD();
        STACKADJ(-2);
        x = build_class(u, v, w);
        SET_TOP(x);
        Py_DECREF(u);
        Py_DECREF(v);
        Py_DECREF(w);

顺着这段起始代码顺藤摸瓜，最后会到命名为type_new的方法中去：

  # in typeobject.c
  static PyObject *
  type_new(PyTypeObject *metatype, PyObject *args, PyObject *kwds) {
        ....
        // dict 可以理解为你将要新建的类的locals，里面便含有__slots__字段
        if (!PyArg_ParseTupleAndKeywords(args, kwds, "SO!O!:type", kwlist,
                                 &name,
                                 &PyTuple_Type, &bases,
                                 &PyDict_Type, &dict))
            return NULL;
        ....
        // 获取__slots__参数
        slots = PyDict_GetItemString(dict, "__slots__");
        nslots = 0;
        add_dict = 0;    // 是否要加入__dict__
        add_weak = 0;  // 是否要加入__weakref__
        
        if (slots == NULL) {
              //... ignore
        } else {
              // 会对slots做一下处理，包括计算nslots，但不影响我们对slots实现的理解
        }
        
        // 为需要创建的类分配空间
        type = (PyTypeObject *)metatype->tp_alloc(metatype, nslots);
        ....
        // 转换指针，变为PyHeapTypeObject，PyHeapTypeObject和PyTypeObject的关系可以认为是包含关系，具体的细节可以再写一篇文章了
        et = (PyHeapTypeObject *)type;
        ....
        // 将slots相关的参数设置为members
        mp = PyHeapType_GET_MEMBERS(et);
        slotoffset = base->tp_basicsize;
        if (slots != NULL) {
            for (i = 0; i < nslots; i++, mp++) {
                mp->name = PyString_AS_STRING(
                              PyTuple_GET_ITEM(slots, i));
                mp->type = T_OBJECT_EX;
                mp->offset = slotoffset;
                ....
                slotoffset += sizeof(PyObject *);
             }
         }
         ....
         type->tp_members = PyHeapType_GET_MEMBERS(et);
         ....
         PyType_Ready(type);
         ....
}

上面我们忽略了一些不相干的代码，代码的主要逻辑就是将__slots__定义的内容放到type的末尾，并且让type的tp_members变量指向type的末尾，这些内容将会在PyType_Ready函数中用到。
这里忽略PyType_Ready的内容，只说明在PyType_Ready中会调用add_members方法，下面看一下add_members的实现：

# in typeobject.c
static int
add_members(PyTypeObject *type, PyMemberDef *memb) {
    PyObject *dict = type->tp_dict;
    for (; memb->name != NULL; memb++) {
          PyObject *descr;
          if (PyDict_GetItemString(dict, memb->name))
              continue;
          descr = PyDescr_NewMember(type, memb);
          if (descr == NULL)
              return -1;
          if (PyDict_SetItemString(dict, memb->name, descr) < 0)
              return -1;
          Py_DECREF(descr);
      }
      return 0;
}

上面的代码逻辑还是很好理解的，将memb里面的内容（即slots的内容）创建为member_descriptor，加入到tp_dict里面去。

Class A的属性设置

实例的属性设置最终会在PyObject_GenericSetAttr方法中处理，PyObject_GenericSetAttr方法又会调用_PyObject_GenericSetAttrWithDict方法，我们来看一下_PyObject_GenericSetAttrWithDict方法到底怎么做的，才可以实现文章开始展示的效果。

int
_PyObject_GenericSetAttrWithDict(PyObject *obj, PyObject *name,
                             PyObject *value, PyObject *dict) {
    PyTypeObject *tp = Py_TYPE(obj);
    descr = _PyType_Lookup(tp, name);
    f = NULL;
    if (descr != NULL &&
        PyType_HasFeature(descr->ob_type,Py_TPFLAGS_HAVE_CLASS)) {
        f = descr->ob_type->tp_descr_set;
        // 对于slots相关的参数将会进入下面的if语句
        if (f != NULL && PyDescr_IsData(descr)) {
            res = f(descr, obj, value);
            goto done;
        }
    }
    ....
    if (dict == NULL) {
        // 对于不是slots提供的属性，尝试去obj自己的dict中查找，
        // 但在构建类时，由于有__slots__属性，所以tp_dictoffset为0，
        // 因此dictptr等于NULL
        dictptr = _PyObject_GetDictPtr(obj);
        if (dictptr != NULL) {
              .... 
        }
    }
    if (dict != NULL) {....}
    if (f != NULL) {....}
    if (descr == NULL) {
        // 此时输出错误信息
        PyErr_Format(PyExc_AttributeError,
                 "'%.100s' object has no attribute '%.200s'",
                 tp->tp_name, PyString_AS_STRING(name));
        goto done;
    }
    ....
}

对于slots定义的变量，会找到对应的descr，调用对应的set方法，对于slots没有定义的变量，最终会跑到抛出异常的那段逻辑。

总结

__slots__的实现还是比较好懂的，Python在构建类的时候，会检查__slots__变量是否存在，如果存在，为slots变量建立member_descriptor，并放入tp_dict里面，并且这个类的tp_dictoffset为0，它的实例将不会有自己的__dict__。

最后编辑于：2017.11.27 04:29:18

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,098评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,213评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,960评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,519评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,512评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,533评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,914评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,574评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,804评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,563评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,644评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,350评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,933评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,908评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,146评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,847评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,361评论 2赞 342

浅析 Python __slots__

Class A的创建

Class A的属性设置

总结

推荐阅读更多精彩内容

浅析 Python slots