深入讲解 PHP 中的生成器(Generator)

PHP

谈到驾驶,速度并非一切。但在网络上,速度变得与众不同。你的应用程序越快,用户体验越好。这篇文章是关于 PHP 生成器的,那么我们为什么要讨论速度呢?你很快就会发现,生成器在速度和内存的管理上发挥着巨大的作用。

PHP生成器是什么?

生成器是在 PHP 5.5 版本中添加的,它提供了一种简单的方法来遍历数据,而不需要在内存中构建数组。是不是有点疑惑?那举一个例子,展示使用生成器是一个好方式。

首先,创建一个 generator.php 文件,它将贯穿我们整个例子。创建文件之后,我们添加一段代码。

<?php

function getRange ($max = 10) {
    $array = [];

    for ($i = 1; $i < $max; $i++) {
        $array[] = $i;
    }

    return $array;
}

foreach (getRange(15) as $range) {
    echo "Dataset {$range} <br>";
}

我们可以在创建 generator.php 文件所在目录中快速启动一个内置的 PHP 服务器:

php -S localhost:8000

如果用浏览器打开 http://localhost:8000/generator.php ,我们应该看到这样的结果:

PHP

这段代码的自解释性并不是太好. 让我们稍微改动一下代码

<?php

foreach (getRange(PHP_INT_MAX) as $range) {
    echo "Dataset {$range} <br>";
}

现在, 上面的这段代码能够生成的最大值是 PHP_INT_MAX (也就是 PHP 能够生成的最大值). 当我们这样修改后刷新浏览器,我们注意到这次有一些不一样. 这段生成器脚本抛出了一条 warning 信息 .

PHP

有点遗憾的是 PHP 耗尽了内存. 你能够想到的解决方法可能包括增加 php.ini 文件中 memory_limit 的上限. 不过平心而论,这个脚本既不高效又占用内存, 我们需要的是一个高效且占用内存低的脚本。

使用生成器

让我们在上面定义相同的函数,用相同的值 PHP_INT_MAX 调用它,然后再次运行。但是这一次我们将创建一个生成器函数。

<?php

function getRange ($max = 10) {
    for ($i = 1; $i < $max; $i++) {
        yield $i;
    }
}

foreach (getRange(PHP_INT_MAX) as $range) {
    echo "Dataset {$range} <br>";
}

解析  getRange 函数,这次,我们只循环遍历值和  yield 输出。 yield 与返回值类似,因为它也是从函数返回一个值,但唯一的区别是  yield 只会在需要时返回一个值,并且不会尝试将整个数据集保留在内存中。

如果您转到浏览器,您应该会看到页面上显示的数据。给定适当的时间,浏览器最终显示数据。

注意: 生成器只能在函数中使用。

为什么要使用生成器

有时候,我们可能会遇到想要解析一个庞大的数据集(也可能是日志文件),也可能对一个大型数据库的结果集执行计算,等等情况。我们不想让这些数据全部加载到内存中。我们应该尽可能的保存相应的内存状态。数据不一定要很大——无论数据有多小,生成器都是有效的。别忘了,我们的目的是使用更少的内存来尽可能快的处理数据。

返回键值对

有时候,我们的数据是基于 key-value 时才更有说服力。使用生成器时,我们可能会生成下面这样的键值对。

<?php

function getRange ($max = 10) {
    for ($i = 1; $i < $max; $i++) {
        $value = $i * mt_rand();

        yield $i => $value;
    }
}

然后,我们可以使用这个键值对,就像使用任意的数组一样。

<?php

foreach (getRange(PHP_INT_MAX) as $range => $value) {
    echo "Dataset {$range} has {$value} value<br>";
}

传递参数到生成器中

生成器也能接收传参。这意味这生成器允许我们向其中注入参数,作为一个命令或者其他作用。例如,我们向生成器发送一个值,让它停止执行或者修改输出结果。使用上面的 getRange 函数,我们可以实现这一点。

<?php

function getRange ($max = 10) {
    for ($i = 1; $i < $max; $i++) {
        $injected = yield $i;

        if ($injected === 'stop') return;
    }
}

要发送注入这个值,我们可以这样做。

<?php

$generator = getRange(PHP_INT_MAX);

foreach ($generator as $range) {
    if ($range === 10000) {
        $generator->send('stop');
    }

    echo "Dataset {$range} <br>";
}

注意: 在生成器中使用 return ,会跳出生成器。

不要滥用生成器

虽然使用 PHP_INT_MAX 有点过了. 但对我来说, PHP_INT_MAX 即 2147483647 也就是:

二十亿四千七百四十万四千八万三千六百四十七

生成器使内存使用更高效。但如果滥用,一样会造成内存相关的问题。

总结

生成器提供了难以忽视的显著性的能提升。大多数的时候,我们不需要高配置的服务器来运行代码。我们只需要做一点重构,生成器是非常有用的,我们应该多多使用它们。

本文中的所有译文仅用于学习和交流目的,转载请务必注明文章译者、出处、和本文链接
我们的翻译工作遵照 CC 协议,如果我们的工作有侵犯到您的权益,请及时联系我们。

原文地址:https://scotch.io/tutorials/understandin...

译文地址:https://learnku.com/php/t/28336

本帖已被设为精华帖!
本文为协同翻译文章,如您发现瑕疵请点击「改进」按钮提交优化建议
讨论数量: 2

可以和鸟哥的这篇文档搭配着看,效果更佳~ http://www.laruence.com/2015/05/28/3038.ht...

4年前 评论
Shuyi

好高级,学到了,谢谢!

4年前 评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!