4.6. PHP 钩子

未匹配的标注

PHP 提供的钩子

PHP 和 Zend Engine 为扩展提供了许多不同的钩子,这些扩展允许扩展开发人员以 PHP userland 无法提供的方式控制 PHP 运行时。

本章将展示各种钩子和从扩展钩子到它们的常见用例。

钩子到 PHP 功能的一般模式是 PHP 核心提供的扩展覆盖函数指针。然后扩展函数通常执行自己的工作并调用原始 PHP 核心函数。使用此模式,不同的扩展可以覆盖同一个钩子而不会导致冲突。

挂钩到函数的执行

userland和内部函数的执行由Zend引擎中的两个函数处理,您可以用自己的实现替换这两个函数。覆盖此钩子的扩展的主要用例是通用函数级评测、调试和面向方面的编程。

钩子在 Zend/zend_execute.h 中定义:

ZEND_API extern void (*zend_execute_ex)(zend_execute_data *execute_data);
ZEND_API extern void (*zend_execute_internal)(zend_execute_data *execute_data, zval *return_value);

如果要覆盖这些函数指针,则必须在 Minit 中执行此操作,因为 Zend Engine 中的其他决策是根据指针是否被覆盖这一事实提前做出的。

覆盖的通常模式是这样的:

static void (*original_zend_execute_ex) (zend_execute_data *execute_data);
static void (*original_zend_execute_internal) (zend_execute_data *execute_data, zval *return_value);
void my_execute_internal(zend_execute_data *execute_data, zval *return_value);
void my_execute_ex (zend_execute_data *execute_data);

PHP_MINIT_FUNCTION(my_extension)
{
    REGISTER_INI_ENTRIES();

    original_zend_execute_internal = zend_execute_internal;
    zend_execute_internal = my_execute_internal;

    original_zend_execute_ex = zend_execute_ex;
    zend_execute_ex = my_execute_ex;

    return SUCCESS;
}

PHP_MSHUTDOWN_FUNCTION(my_extension)
{
    zend_execute_internal = original_zend_execute_internal;
    zend_execute_ex = original_zend_execute_ex;

    return SUCCESS;
}

覆盖 zend_execute_ex 的一个缺点是它将 Zend Virtual Machine 运行时的行为更改为使用递归,而不是在不离开解释器循环的情况下处理调用。此外,没有覆盖zend_execute_ex的 PHP 引擎也可以生成更优化的函数调用操作码。

这些挂钩对性能非常敏感,具体取决于原始函数封装代码的复杂性。

覆盖内部功能

在覆盖执行钩子时,扩展可以记录每个函数调用,你还可以覆盖用户域,核心和扩展函数(和方法)的各个函数指针。如果扩展仅需要访问特定的内部函数调用,则具有更好的性能特征。

#if PHP_VERSION_ID < 70200
typedef void (*zif_handler)(INTERNAL_FUNCTION_PARAMETERS);
#endif
zif_handler original_handler_var_dump;

ZEND_NAMED_FUNCTION(my_overwrite_var_dump)
{
    // 如果我们想调用原始函数
    original_handler_var_dump(INTERNAL_FUNCTION_PARAM_PASSTHRU);
}

PHP_MINIT_FUNCTION(my_extension)
{
    zend_function *original;

    original = zend_hash_str_find_ptr(CG(function_table), "var_dump", sizeof("var_dump")-1);

    if (original != NULL) {
        original_handler_var_dump = original->internal_function.handler;
        original->internal_function.handler = my_overwrite_var_dump;
    }
}

覆盖类方法时,可以在 zend_class_entry上找到函数表:

zend_class_entry *ce = zend_hash_str_find_ptr(CG(class_table), "PDO", sizeof("PDO")-1);
if (ce != NULL) {
    original = zend_hash_str_find_ptr(&ce->function_table, "exec", sizeof("exec")-1);

    if (original != NULL) {
        original_handler_pdo_exec = original->internal_function.handler;
        original->internal_function.handler = my_overwrite_pdo_exec;
    }
}

修改抽象语法树(AST)

当 PHP 7编译 PHP 代码时,它会先将其转换为抽象语法树(AST),然后最终生成持久存储在 Opcache 中的操作码。zend_ast_process钩子会被每个已编译的脚本调用,并允许你在解析和创建 AST 之后修改 AST。

这是要使用的最复杂的钩子之一,因为它需要完全了解 AST。在此处创建无效的 AST 可能会导致异常行为或崩溃。

最好看看使用此钩子的示例扩展:

熟悉脚本/文件编译

每当用户脚本调用include/require或其对应的include_once/require_once时,PHP内核都会在指针zend_compile_file处调用该函数处理此请求。参数是文件句柄,结果是zend_op_array

zend_op_array * my_extension_compile_file(zend_file_handle * file_handle,int类型);

PHP核心中有两个扩展实现了此挂钩:dtrace和opcache。

-如果您使用环境变量USE_ZEND_DTRACE启动PHP脚本并使用dtrace支持编译了PHP,则dtrace_compile_file用于Zend / zend_dtrace.c
-Opcache将操作数组存储在共享内存中以获得更好的性能,因此,每当脚本被编译时,其最终的操作数组都会从缓存中得到服务,而不是重新编译。您可以在ext / opcache / ZendAccelerator.c中找到此实现。
-名为compile_file的默认实现是Zend / zend_language_scanner.l中扫描程序代码的一部分。

实施此挂钩的用例是Opcode Accelerating,PHP代码加密/解密,调试或概要分析。

您可以随时在执行PHP进程时替换该挂钩,并且替换后编译的所有PHP脚本都将由该挂钩的实现处理。

始终调用原始函数指针非常重要,否则PHP将无法再编译脚本,并且Opcache将不再起作用。

此处的扩展覆盖顺序也很重要,因为您需要知道是要在Opcache之前还是之后注册钩子,因为Opcache如果在其共享内存缓存中找到操作码数组条目,则不会调用原始函数指针。 Opcache将其钩子注册为启动后钩子,该钩子在扩展的minit阶段之后运行,因此默认情况下,缓存脚本时将不再调用该钩子。

调用错误处理程序时的通知

与PHP用户区set_error_handler()函数类似,扩展可以通过实现zend_error_cb钩子将自身注册为错误处理程序:

ZEND_API void(* zend_error_cb)(int类型,const char * error_filename,const uint32_t error_lineno,const char * format,va_list args);

type变量对应于E _ *错误常量,该常量在PHP用户区中也可用。

PHP核心和用户态错误处理程序之间的关系很复杂:

1.如果未注册任何用户级错误处理程序,则始终调用zend_error_cb
2.如果注册了userland错误处理程序,则对于E_ERRORE_PARSEE_CORE_ERRORE_CORE_WARNINGE_COMPILE_ERROR的所有错误E_COMPILE_WARNING始终调用zend_error_cb挂钩。
3.对于所有其他错误,仅在用户态处理程序失败或返回false时调用zend_error_cb

另外,由于Xdebug自身复杂的实现,它以不调用以前注册的内部处理程序的方式覆盖错误处理程序。

因此,覆盖此挂钩不是很可靠。

再次覆盖应该以尊重原始处理程序的方式进行,除非您想完全替换它:

void(* original_zend_error_cb)(int类型,const char * error_filename,const uint error_lineno,const char * format,va_list args);

void my_error_cb(int类型,const char * error_filename,const uint error_lineno,const char * format,va_list args)
{
    //我的特殊错误处理

    original_zend_error_cb(type,error_filename,error_lineno,format,args);
}

PHP_MINIT_FUNCTION(my_extension)
{
    original_zend_error_cb = zend_error_cb;
    zend_error_cb = my_error_cb;

    return SUCCESS;
}

PHP_MSHUTDOWN(my_extension)
{
    zend_error_cb = original_zend_error_cb;
}

该挂钩主要用于为异常跟踪或应用程序性能管理软件实施集中式异常跟踪。

引发异常时的通知

每当PHP Core或Userland代码引发异常时,都会调用zend_throw_exception_hook并将异常作为参数。

这个钩子的签名非常简单:

void my_throw_exception_hook(zval * exception)
{
    if(original_zend_throw_exception_hook!= NULL){
        original_zend_throw_exception_hook(exception);
    }
}

该挂钩没有默认实现,如果未被扩展覆盖,则指向NULL

static void(* original_zend_throw_exception_hook)(zval * ex);
void my_throw_exception_hook(zval * exception);

PHP_MINIT_FUNCTION(my_extension)
{
    original_zend_throw_exception_hook = zend_throw_exception_hook;
    zend_throw_exception_hook = my_throw_exception_hook;

    return SUCCESS;
}

如果实现此挂钩,请注意无论是否捕获到异常,都会调用此挂钩。将异常临时存储在此处,然后将其与错误处理程序挂钩的实现结合起来以检查异常是否未被捕获并导致脚本停止,仍然有用。

实现此挂钩的用例包括调试,日志记录和异常跟踪。

挂接到eval()

PHPeval不是内部函数,而是一种特殊的语言构造。因此,您无法通过zend_execute_internal或通过覆盖其函数指针来连接它。

挂钩到eval的用例并不多,您可以将其用于概要分析或出于安全目的。如果更改其行为,请注意可能需要评估其他扩展名。一个示例是Xdebug,它使用它执行断点条件。

extern ZEND_API zend_op_array *(* zend_compile_string)(zval * source_string,char * filename);

挂入垃圾收集器

当可收集对象的数量达到一定阈值时,引擎本身会调用gc_collect_cycles()或隐式地触发PHP垃圾收集器。

为了使您了解垃圾收集器的工作方式或分析其性能,可以覆盖执行垃圾收集操作的函数指针挂钩。从理论上讲,您可以在此处实现自己的垃圾收集算法,但是如果有必要对引擎进行其他更改,则这可能实际上并不可行。

int(* original_gc_collect_cycles)(无效);

int my_gc_collect_cycles(无效)
{
    original_gc_collect_cycles();
}

PHP_MINIT_FUNCTION(my_extension)
{
    original_gc_collect_cycles = gc_collect_cycles;
    gc_collect_cycles = my_gc_collect_cycles;

    return SUCCESS;
}

覆盖中断处理程序

当执行器全局EG(vm_interrupt)设置为1时,将调用一次中断处理程序。在执行用户域代码期间,将在常规检查点对它进行检查。引擎使用此挂钩通过信号处理程序实现PHP执行超时,该信号处理程序在达到超时持续时间后将中断设置为1。

当更安全地清理或实现自己的超时处理时,这有助于将信号处理推迟到运行时执行的后期。通过设置此挂钩,您不会意外禁用PHP的超时检查,因为它具有自定义处理的优先级,该优先级高于对zend_interrupt_function的任何覆盖。

ZEND_API void(* original_interrupt_function)(zend_execute_data * execute_data);

void my_interrupt_function(zend_execute_data * execute_data)
{
    if(original_interrupt_function!= NULL){
        original_interrupt_function(execute_data);
    }
}

PHP_MINIT_FUNCTION(my_extension)
{
    original_interrupt_function = zend_interrupt_function;
    zend_interrupt_function = my_interrupt_function;

    return SUCCESS;
}

替换操作码处理程序

可以为操作码覆盖 Zend 引擎的单个处理程序。这可能有助于忽略@操作符或计算每个操作码执行的频率。引擎中的 API 只是为每个操作码有一个扩展定义的处理程序做好了准备,这使得作为一个扩展作者,处理其他扩展已经设置的处理程序变得非常重要。
引擎的基本 api 包括:

void zend_set_user_opcode_handler(int opcode, user_opcode_handler_t handler);
user_opcode_handler_t zend_get_user_opcode_handler(int opcode);

user_opcode_handler_t 是一个函数指针,每个处理程序都有以下签名[1] _:

int my_handler(zend_execute_data *execute_data);

处理程序的返回值非常重要,并且定义了一些具有以下含义的常量:

ZEND_USER_OPCODE_CONTINUE
Execute next opcode

ZEND_USER_OPCODE_RETURN
Exit from executor (return from function)

ZEND_USER_OPCODE_DISPATCH
Call original opcode handler

ZEND_USER_OPCODE_ENTER
Enter into new op_array without recursion

ZEND_USER_OPCODE_LEAVE
Return to calling op_array within the same executor

在下面的例子中,我们将覆盖用于实现@操作符的 zend_begin _ silence 和 zend_end _ silence 操作码。基于扩展全局(无静默) ,它要么跳过操作码,要么让引擎正常工作:

ZEND_BEGIN_MODULE_GLOBALS(my_extension)
    int                   no_silence;
    user_opcode_handler_t original_begin_silence_handler;
    user_opcode_handler_t original_end_silence_handler
ZEND_END_MODULE_GLOBALS(my_extension)

static int silence_handler(zend_execute_data *execute_data)
{
    if (MYEXTG(no_silence)) {
        execute_data->opline++;
        return ZEND_USER_OPCODE_CONTINUE;
    }

    /* We select the handler depending on which opcode this handler is called *for* */
    if (execute_data->opline == ZEND_BEGIN_SILENCE) {
        /* Only call the original handler if it wasn't NULL */
        if (MYEXTG(original_begin_silence_handler)(execute_data)) {
            return MYEXTG(original_begin_silence_handler)(execute_data);
        }
    } else {
        if (MYEXTG(original_end_silence_handler)(execute_data)) {
            return MYEXTG(original_end_silence_handler)(execute_data);
        }
    }

    /* If the original handler was NULL, instruct the VM to do whatever it needs to */
    return ZEND_USER_OPCODE_DISPATCH;
}

PHP_MINIT_FUNCTION(my_extension)
{
    MYEXTG(original_begin_silence_handler) = zend_get_user_opcode_handler(ZEND_BEGIN_SILENCE);
    MYEXTG(original_end_silence_handler) = zend_get_user_opcode_handler(ZEND_END_SILENCE);
    zend_set_user_opcode_handler(ZEND_BEGIN_SILENCE, silence_handler);
    zend_set_user_opcode_handler(ZEND_END_SILENCE, silence_handler);

    return SUCCESS;
}

PHP_MSHUTDOWN_FUNCTION(my_extension)
{
    zend_set_user_opcode_handler(ZEND_BEGIN_SILENCE, MYEXTG(original_begin_silence_handler));
    zend_set_user_opcode_handler(ZEND_END_SILENCE, MYEXTG(original_end_silence_handler));

    return SUCCESS;
}
  1. 在 PHP 8中,这个签名正在改变,并且在是否启用特定的 GCC 特性上会有所不同。

本文章首发在 LearnKu.com 网站上。

本译文仅用于学习和交流目的,转载请务必注明文章译者、出处、和本文链接
我们的翻译工作遵照 CC 协议,如果我们的工作有侵犯到您的权益,请及时联系我们。

原文地址:https://learnku.com/docs/php-internals/p...

译文地址:https://learnku.com/docs/php-internals/p...

上一篇 下一篇
贡献者:5
讨论数量: 0
发起讨论 查看所有版本


暂无话题~