在通常的应用场景中,PHP开发者并不需要关心底层的垃圾回收机制。因为在一个完成请求周期之后,PHP进程将被释放,所有内存里的变量也将被清空。但当以CLI的方式长时间运行PHP脚本,PHP的垃圾回收将变得重要。
PHP的垃圾回收机制经理过3个不同的时期:5.2及之前版本、5.3-5.6、7.0之后。下面分别详细讲讲。
5.2及之前版本
首先我们看一下PHP是怎么储存变量的:
typedefstruct_zval_struct{zvalue_value value;zend_uint refcount__gc;zend_uchar type;zend_uchar is_ref__gc;}zval;
上面是PHP储存变量信息的源码,是一个C的结构体。我们可以看到有两个有__gc后缀的字段:refcount__gc,is_ref__gc。其中refcount是引用计数,is_ref是“是否是引用变量”的标识。引用计数会在有变量指向它的时候加1,变量被unset的时候减1。
这个时期PHP并没有专门的垃圾回收器 ,要判断一个变量容器的是否可以被释放,就是判断refcount是否为0,为0的时候就立即释放。
但这样的方式无法判断变量循环引用,于是无法释放变量容器,导致PHP存在内存泄漏,因此在5.3引入了新的垃圾回收机制。
5.3-5.6版本
在这些版本中,PHP把那些可能是垃圾的变量容器放入根缓冲区,当根缓冲区满了之后就会启动新的垃圾回收机制。
首先要清楚一点,什么是可能的垃圾。如果变量容器的refount增加,那么显然有新的变量指向它,它就不可能是垃圾。而如果一个变量容器的refcount减到0,那么它自然会被释放。只有像上面所说的,当一个变量容器的refcount减少,但不为0的时候,它才可能是一个垃圾,才会进入垃圾回收周期。
在垃圾回收中,判断一个容器是否是真的垃圾,其思路并不复杂:如果一个变量容器的refcount的值全部来自其引用自身,那么它是一个垃圾。具体操作是对变量及其成员的refcount进行模拟删除,即减1的操作,如果像我们上面说的,如果它的refcount值都来自其成员引用自身,那么模拟删除后,它的refcount值就会变成0,因此我们可以断定它是一个垃圾,要进行回收。
7.0之后
PHP7对比PHP5在性能上是一个很大的提升,内存消耗也要少不少。这是得益于PHP变量容器zval的全新设计。
struct_zval_struct{zend_value value;union{struct{ZEND_ENDIAN_LOHI_4(zend_uchar type,zend_uchar type_flags,zend_uchar const_flags,zend_uchar reserved)}v;uint32_t type_info;}u1;union{uint32_t var_flags;uint32_t next;// hash collision chainuint32_t cache_slot;// literal cache slotuint32_t lineno;// line number (for ast nodes)uint32_t num_args;// arguments number for EX(This)uint32_t fe_pos;// foreach positionuint32_t fe_iter_idx;// foreach iterator index}u2;};
在PHP7中不同类型的变量储存及销毁的方式并不相同。
对于简单变量,如整数、浮点数、布尔值等,PHP不再是写时复制,而是即时分配,因此不需要refcount。当unset掉一个变量的时候,对应的zval容器会被标记为IS_UNDEF,等待释放。
对于复杂变量如数组、对象等,PHP还是共享一个zval, 写时复制。当发生变量引用时,PHP会分配一个zend_reference结构。变量指向这个zend_reference结构,里面保存着refcount计数,这个结构再指向实际zval容器。因此当发生循环引用,进入回收周期之后,PHP会对这个zend_reference结构进行模拟删除操作,如同PHP5一样。
typedefstruct_zend_refcounted_h{uint32_t refcount;// 记录 zend_value 的引用数union{struct{zend_uchar type,// zend_value的类型, 与zval.u1.type一致zend_uchar flags,uint16_t gc_info// GC信息,记录在 gc 池中的位置和颜色,垃圾回收的过程会用到}v;uint32_t type_info;}u;}zend_refcounted_h;