PHP 垃圾回收机制

引用计数基本知识:

每个php变量存在一个叫”zval”的变量容器中。一个zval变量容器,除了包含变量的类型和值,还包括两个字节的额外信息。
第一个是”is_ref”,是个bool值,用来标识这个变量是否是属于引用集合(reference set)。通过这个字节,php引擎才能把普通变量和引用变量区分开来,由于php允许用户通过使用&来使用自定义引用,zval变量容器中还有一个内部引用计数机制,来优化内存使用。
第二个额外字节是”refcount”,用以表示指向这个zval变量容器的变量(也称符号即symbol)个数。所有的符号存在一个符号表中,其中每个符号都有作用域(scope),那些主脚本(比如:通过浏览器请求的的脚本)和每个函数或者方法也都有作用域。


接下来我们来验证这些,首先安装xdebug:(如果你已经安装了xdebug则直接跳过这段)

xdebug官网下载最新的安装包,
如:
wget https://xdebug.org/files/xdebug-2.5.5.tgz

tar -zxvf xdebug-2.5.5.tgz && cd  xdebug-2.5.5

./configure

make && make install
151551667684_.pic_hd
然后添加 zend_extension=”xdebug.so” 至你的php.ini文件中 重启php-fpm就ok了


 

当一个变量被赋常量值时,就会生成一个zval变量容器,如下例这样:

WeChat2d636ba6bb25681839f0ace011a18a56       WeChatb294b7a879796e0df74ba8879c9d69b0
把一个变量赋值给另一变量将增加引用次数(refcount)。
注意到当”refcount”的值是1时,”is_ref”的值总是FALSE. 当$b = &$a 时,$b 的is_ref就为1了 表示引用变量
变量容器在”refcount“变成0时就被销毁. 当任何关联到某个变量容器的变量离开它的作用域(比如:函数执行结束),或者对变量调用了函数 unset()时,”refcount“就会减1

复合类型:
当考虑像 arrayobject这样的复合类型时,事情就稍微有点复杂. 与 标量(scalar)类型的值不同,array和 object类型的变量把它们的成员或属性存在自己的符号表中。

WeChatad31a1e977efd9478bf28f513880c46a
这个时候生成了三个zval变量容器: ameaning和 number。增加和减少”refcount”的规则和上面提到的一样
WeChat4e2bc0f804fecb22bd3b8cbd40c35971

 

下面, 我们在数组中再添加一个元素,并且把它的值设为数组中已存在元素的值:
WeChat2411864fadadb87b2614cdc9bb056379

从以上的xdebug输出信息,我们看到原有的数组元素和新添加的数组元素关联到同一个”refcount”2的zval变量容器. 尽管 Xdebug的输出显示两个值为‘life’的 zval 变量容器,其实是同一个。 函数xdebug_debug_zval()不显示这个信息,但是你能通过显示内存指针信息来看到。

WeChat89f1ff42c61b62b7af688761d363c0e1

删除数组中的一个元素,就是类似于从作用域中删除一个变量. 
删除后,数组中的这个元素所在的容器的“refcount”值减少,同样,当“refcount”为0时,这个变量容器就从内存中被删除,下面又一个例子可以说明:

WeChatc754249808072cef0193dfd050292eed

当我们添加一个数组本身作为这个数组的元素时,事情变得有趣了:
WeChat93c18adf48d6a5022746f7c0bb5679fd

能看到数组变量 (a) 同时也是这个数组的第二个元素(1) 指向的变量容器中“refcount”为 2。上面的输出结果中的”…”说明发生了递归操作, 显然在这种情况下意味着”…”指向原始数组。

跟刚刚一样,对一个变量调用unset,将删除这个符号,且它指向的变量容器中的引用次数也减1。所以,如果我们在执行完上面的代码后,对变量$a调用unset, 那么变量 $a 和数组元素 “1” 所指向的变量容器的引用次数减1, 从”2″变成”1″. 下例可以说明:

 WeChat6a26169180fefcc6986f87b86445ed3b

清理变量容器的问题:

尽管不再有某个作用域中的任何符号指向这个结构(就是变量容器),由于数组元素“1”仍然指向数组本身,所以这个容器不能被清除 。因为没有另外的符号指向它,用户没有办法清除这个结构,结果就会导致内存泄漏。庆幸的是,php将在脚本执行结束时清除这个数据结构,但是在php清除之前,将耗费不少内存。如果你要实现分析算法,或者要做其他像一个子元素指向它的父元素这样的事情,这种情况就会经常发生。当然,同样的情况也会发生在对象上,实际上对象更有可能出现这种情况,因为对象总是隐式的被引用。

回收周期 与 解决方案:
php从5.3起使用 引用计数系统中的同步周期回收 中的回收算法,来处理这个内存泄漏问题。
默认的,PHP的垃圾回收机制是打开的,然后有个 php.ini 设置允许你修改它:zend.enable_gc 。当垃圾回收机制打开时,每当根缓存区存满时,就会执行上面描述的循环查找算法。
除了修改配置zend.enable_gc ,也能通过分别调用gc_enable() 和 gc_disable()函数来打开和关闭垃圾回收机制。调用这些函数,与修改配置项来打开或关闭垃圾回收机制的效果是一样的。即使在可能根缓冲区还没满时,也能强制执行周期回收。你能调用gc_collect_cycles()函数达到这个目的。这个函数将返回使用这个算法回收的周期数。

  结论 

通常,PHP中的垃圾回收机制,仅仅在循环回收算法确实运行时会有时间消耗上的增加。但是在平常的(更小的)脚本中应根本就没有性能影响。

然而,在平常脚本中有循环回收机制运行的情况下,内存的节省将允许更多这种脚本同时运行在你的服务器上。因为总共使用的内存没达到上限。

这种好处在长时间运行脚本中尤其明显,诸如长时间的测试套件或者daemon脚本此类。同时,对通常比Web脚本运行时间长的» PHP-GTK应用程序,新的垃圾回收机制,应该会大大改变一直以来认为内存泄漏问题难以解决的看法。

参考文献:http://php.net/manual/zh/features.gc.php

发表评论

邮箱地址不会被公开。