PHP7的垃圾回收机制是如何运作的?

2026-04-03 11:321阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计1631个文字,预计阅读时间需要7分钟。

PHP7的垃圾回收机制是如何运作的?

PHP7+垃圾回收机制详解,作者前几日对此话题感兴趣,一搜网上几乎全是PHP5的垃圾回收机制内容。固然PHP5到PHP7的GC部分变动不大,但我觉得仍有必要单独做一篇文章探讨。

PHP7的垃圾回收机制是如何运作的?

php7 垃圾回收机制详解

笔者前几天对这个话题感兴趣,于是到网上一搜,几乎都是 php 5的垃圾回收机制,虽然 php5 到 php7 GC部分做出的改动较小,但我觉得还是有必要单独做一遍博文出来。 不特意说明的话 php 版本为 7.2

在php中的变量占用的空间,是不需要我们手动回收的。内核帮我们处理了这一部分的工作。相比C,这大大方便了我们的操作。

本篇主要讲解 变量的 GC机制

在了解我们 php GC 时,我觉得我有必要介绍一下们的 php 的变量在底层的实现。

zval 的结构

// php 变量对于的c结构体 struct _zval_struct { zend_value value; union { …… } u1; union { …… } u2; };

由于主要讲垃圾回收,所以在这里简单介绍下 u1 u2 联合体的功能

u1 结构比较复杂,我认为主要是用于识别变量类型

u2 这里面大多都是辅助字段,变量内部功能的实现、提升缓存友好性等等

接下来是我们的主角

zend_value 它也是结构体中内嵌的一个联合体

typedef union _zend_value { zend_long lval;//整形 double dval;//浮点型 zend_refcounted *counted;//获取不同类型的gc头部 zend_string *str;//string字符串 zend_array *arr;//数组 zend_object *obj;//对象 zend_resource *res;//资源 zend_reference *ref;//是否是引用类型 // 忽略下面的结构,与我们讨论无关 zend_ast_ref *ast; zval *zv; void *ptr; zend_class_entry *ce; zend_function *func; struct { ZEND_ENDIAN_LOHI( uint32_t w1, uint32_t w2) } ww; } zend_value;

在 zval的 value中就记录了引用计数zend_refcounted *counted这个类型,我们的垃圾回收机制也是基于此的。

typedef struct _zend_refcounted_h { uint32_t refcount; /* reference counter 32-bit */ union { struct { ZEND_ENDIAN_LOHI_3( zend_uchar type, zend_uchar flags, /* used for strings & objects */ uint16_t gc_info) /* keeps GC root number (or 0) and color */ } v; uint32_t type_info; } u; } zend_refcounted_h;

所有的复杂类型的定义, 开始的时候都是zend_refcounted_h结构, 这个结构里除了引用计数以外, 还有GC相关的结构. 从而在做GC回收的时候, GC不需要关心具体类型是什么, 所有的它都可以当做zend_refcounted*结构来处理.

变量的自动回收

在php中 除了 array和object类型的变量,其余大部分是自动回收

php 普通变量的回收和 该变量的引用次数有关。

官方的例子

$a = 1; $b = $a; xdebug_debug_zval('a'); $a =10; xdebug_debug_zval('a'); unset($a); xdebug_debug_zval('a');

结果

a: (refcount=2, is_ref=0),int 1 a: (refcount=1, is_ref=0),int 10 a: no such symbol

可以看到 当$a =10 的时候 涉及到 php的COW(copy-on-write)机制,$b 会复制一份原先的 $a ,解除了他们之间的引用关系,所以a的引用次数(refcount)减少为1。

然后我们uset($a)之后 a的引用次数变为0。这就会被认为是垃圾变量,释放空间。

在举一个例子

$a = [1]; $a[1] = &$a; unset($a);

在 unset($a) 之前 $a 的类型为引用类型

a: (refcount=2, is_ref=1), array (size=2) 0 => (refcount=1, is_ref=0),int 1 1 => (refcount=2, is_ref=1), &array<

unset($a) 之后,就变成这样

这时候,我们unset操作时refcount 由2变为1,因为有内部引用指向 $a,所以在外部 其所占用的空间并不会被销毁。

然后我们的外部引用已经被中断了,我们也不能使用它。它就成了一个“孤儿”,在c语言中叫做野指针。在php中叫做循环引用。内存泄漏。想要销毁变量的话,只能等 php脚本结束。

循环引用造成的内存泄漏

为了清理这些垃圾,引入了两个准则

● 如果引用计数减少到零,所在变量容器将被清除(free),不属于垃圾

● 如果一个zval 的引用计数减少后还大于0,那么它会进入垃圾周期。其次,在一个垃圾周期中,通过检查引用计数是否减1,并且检查哪些变量容器的引用次数是零,来发现哪部分是垃圾。

循环引用基本上只会出现在 数组和对象中,对象是因为它的本身就是引用

object和array的回收过程

php7的垃圾回收包含两个部分,一个是垃圾收集器,一个是垃圾回收算法。

垃圾收集器,把刚刚提到的,可能是垃圾的元素收集到回收池中 也就是把变量的 zend_refcount的信息 放在回收池中。 当回收池的值达到一定额度了,会进行统一处理。

处理的过程呢,就比较简单。

遍历回收池中的每一个变量,根据每一个变量,再遍历每一个成员,如果成员还有嵌套的话继续遍历。然后把所有成员的 做模拟的 refcount -1。如果此时外部的变量的 引用次数为 0 。那么可以视为垃圾,清楚。如果大于0,那么恢复引用次数,并从垃圾回收池中取出。

垃圾回收的原理

如果你这个变量不是垃圾,那么它的所有成员变量的引用减一之后,必然不会是总变量的引用为0。

例子

说的比较死,不如举个例子。刚刷 sf.gg 的时候看到一道关于 GC 的题,我回答了一波。关于GC垃圾回收机制

题目如下

//我的回答 1、只要zval.value的refcount减一,然后缺其refcount的值不为0那么它就可能是垃圾,进入垃圾周期。 2、进入垃圾池遍历所有成员,包括其嵌套的成员,都对其做 refcount-1的操作,看外部的引用是否为0。 那么对于 题主的问题来说, 首先,你要想$a为垃圾,一定要先对 unset($a)操作,那么此时 $a的 refcount = 2 对于$a[0] refcount-1 不影响外部的$a, $a[1] refcount-1 ,此时 $a的 refount=1 $a[2] refcount-1 ,此时 $a 的 refount=0 模拟减结束,那么此变量被当成垃圾回收。

本文共计1631个文字,预计阅读时间需要7分钟。

PHP7的垃圾回收机制是如何运作的?

PHP7+垃圾回收机制详解,作者前几日对此话题感兴趣,一搜网上几乎全是PHP5的垃圾回收机制内容。固然PHP5到PHP7的GC部分变动不大,但我觉得仍有必要单独做一篇文章探讨。

PHP7的垃圾回收机制是如何运作的?

php7 垃圾回收机制详解

笔者前几天对这个话题感兴趣,于是到网上一搜,几乎都是 php 5的垃圾回收机制,虽然 php5 到 php7 GC部分做出的改动较小,但我觉得还是有必要单独做一遍博文出来。 不特意说明的话 php 版本为 7.2

在php中的变量占用的空间,是不需要我们手动回收的。内核帮我们处理了这一部分的工作。相比C,这大大方便了我们的操作。

本篇主要讲解 变量的 GC机制

在了解我们 php GC 时,我觉得我有必要介绍一下们的 php 的变量在底层的实现。

zval 的结构

// php 变量对于的c结构体 struct _zval_struct { zend_value value; union { …… } u1; union { …… } u2; };

由于主要讲垃圾回收,所以在这里简单介绍下 u1 u2 联合体的功能

u1 结构比较复杂,我认为主要是用于识别变量类型

u2 这里面大多都是辅助字段,变量内部功能的实现、提升缓存友好性等等

接下来是我们的主角

zend_value 它也是结构体中内嵌的一个联合体

typedef union _zend_value { zend_long lval;//整形 double dval;//浮点型 zend_refcounted *counted;//获取不同类型的gc头部 zend_string *str;//string字符串 zend_array *arr;//数组 zend_object *obj;//对象 zend_resource *res;//资源 zend_reference *ref;//是否是引用类型 // 忽略下面的结构,与我们讨论无关 zend_ast_ref *ast; zval *zv; void *ptr; zend_class_entry *ce; zend_function *func; struct { ZEND_ENDIAN_LOHI( uint32_t w1, uint32_t w2) } ww; } zend_value;

在 zval的 value中就记录了引用计数zend_refcounted *counted这个类型,我们的垃圾回收机制也是基于此的。

typedef struct _zend_refcounted_h { uint32_t refcount; /* reference counter 32-bit */ union { struct { ZEND_ENDIAN_LOHI_3( zend_uchar type, zend_uchar flags, /* used for strings & objects */ uint16_t gc_info) /* keeps GC root number (or 0) and color */ } v; uint32_t type_info; } u; } zend_refcounted_h;

所有的复杂类型的定义, 开始的时候都是zend_refcounted_h结构, 这个结构里除了引用计数以外, 还有GC相关的结构. 从而在做GC回收的时候, GC不需要关心具体类型是什么, 所有的它都可以当做zend_refcounted*结构来处理.

变量的自动回收

在php中 除了 array和object类型的变量,其余大部分是自动回收

php 普通变量的回收和 该变量的引用次数有关。

官方的例子

$a = 1; $b = $a; xdebug_debug_zval('a'); $a =10; xdebug_debug_zval('a'); unset($a); xdebug_debug_zval('a');

结果

a: (refcount=2, is_ref=0),int 1 a: (refcount=1, is_ref=0),int 10 a: no such symbol

可以看到 当$a =10 的时候 涉及到 php的COW(copy-on-write)机制,$b 会复制一份原先的 $a ,解除了他们之间的引用关系,所以a的引用次数(refcount)减少为1。

然后我们uset($a)之后 a的引用次数变为0。这就会被认为是垃圾变量,释放空间。

在举一个例子

$a = [1]; $a[1] = &$a; unset($a);

在 unset($a) 之前 $a 的类型为引用类型

a: (refcount=2, is_ref=1), array (size=2) 0 => (refcount=1, is_ref=0),int 1 1 => (refcount=2, is_ref=1), &array<

unset($a) 之后,就变成这样

这时候,我们unset操作时refcount 由2变为1,因为有内部引用指向 $a,所以在外部 其所占用的空间并不会被销毁。

然后我们的外部引用已经被中断了,我们也不能使用它。它就成了一个“孤儿”,在c语言中叫做野指针。在php中叫做循环引用。内存泄漏。想要销毁变量的话,只能等 php脚本结束。

循环引用造成的内存泄漏

为了清理这些垃圾,引入了两个准则

● 如果引用计数减少到零,所在变量容器将被清除(free),不属于垃圾

● 如果一个zval 的引用计数减少后还大于0,那么它会进入垃圾周期。其次,在一个垃圾周期中,通过检查引用计数是否减1,并且检查哪些变量容器的引用次数是零,来发现哪部分是垃圾。

循环引用基本上只会出现在 数组和对象中,对象是因为它的本身就是引用

object和array的回收过程

php7的垃圾回收包含两个部分,一个是垃圾收集器,一个是垃圾回收算法。

垃圾收集器,把刚刚提到的,可能是垃圾的元素收集到回收池中 也就是把变量的 zend_refcount的信息 放在回收池中。 当回收池的值达到一定额度了,会进行统一处理。

处理的过程呢,就比较简单。

遍历回收池中的每一个变量,根据每一个变量,再遍历每一个成员,如果成员还有嵌套的话继续遍历。然后把所有成员的 做模拟的 refcount -1。如果此时外部的变量的 引用次数为 0 。那么可以视为垃圾,清楚。如果大于0,那么恢复引用次数,并从垃圾回收池中取出。

垃圾回收的原理

如果你这个变量不是垃圾,那么它的所有成员变量的引用减一之后,必然不会是总变量的引用为0。

例子

说的比较死,不如举个例子。刚刷 sf.gg 的时候看到一道关于 GC 的题,我回答了一波。关于GC垃圾回收机制

题目如下

//我的回答 1、只要zval.value的refcount减一,然后缺其refcount的值不为0那么它就可能是垃圾,进入垃圾周期。 2、进入垃圾池遍历所有成员,包括其嵌套的成员,都对其做 refcount-1的操作,看外部的引用是否为0。 那么对于 题主的问题来说, 首先,你要想$a为垃圾,一定要先对 unset($a)操作,那么此时 $a的 refcount = 2 对于$a[0] refcount-1 不影响外部的$a, $a[1] refcount-1 ,此时 $a的 refount=1 $a[2] refcount-1 ,此时 $a 的 refount=0 模拟减结束,那么此变量被当成垃圾回收。