PHP array_search 和 in_array 函数效率问题

问题#

在一个接口中,发现非常耗时,排查原因发现 array_search 查找数组中的元素的 key 时,效率随着数组变大,耗时增加。特别是大数组时,非常耗时。在函数 in_array 也有这个问题。

解决办法#

采用 array_flip 翻转后,用 isset 代替 in_array 函数,用 $array[key] 替代 array_search, 这样能解决大数组超时耗时问题

下面是我从 php 官网抄下来的笔记,可以观察这两个方法效率的差异
原网址https://www.php.net/manual/en/function.in-...

If you're working with very large 2 dimensional arrays (eg 20,000+ elements) it's much faster to do this...

$needle = 'test for this';

$flipped_haystack = array_flip($haystack);

if ( isset($flipped_haystack[$needle]) )
{
  print "Yes it's there!";
}

I had a script that went from 30+ seconds down to 2 seconds (when hunting through a 50,000 element array 50,000 times).

Remember to only flip it once at the beginning of your code though!

--------------------2019-10-14 更新 ----------------------

更正#

有人提出意见说道,array_flip 效率比 in_arrayarray_search 高,做了一些实验,确实如此。这点是我原来没有考虑到问题。这个解决办法,适用于多次使用 in_arrayarray_search 函数,才有效。下面是自己做实验的结果。感谢 @木偶指出的问题

<?php
$array = array();

for ($i=0; $i<200000; $i++){
    ##随机字符串
    $array[$i] = get_rand().$i;
}

$str = $array[150000];
$time1 = microtime(true);
array_search($str, $array);
$time2 = microtime(true);
echo '原始方法:'.($time2-$time1)."\n";

$time3 =  microtime(true);
$new_array = array_flip($array);
isset($new_array[$str]);
$time4 = microtime(true);
echo '新方法:'.($time4-$time3);

结果:

原始方法:0.0010008811950684
新方法:0.0069980621337891

循环 5000 次

$array = array();

for ($i=0; $i<200000; $i++){
    ##随机字符串
    $array[$i] = get_rand().$i;
}

$str = $array[199999];
$time1 = microtime(true);
for ($i=0; $i<5000; $i++){
    array_search($str, $array);
}
$time2 = microtime(true);

echo '原始方法:'.($time2-$time1)."\n";

$time3 =  microtime(true);
$new_array = array_flip($array);
for ($i=0; $i<5000; $i++){
    isset($new_array[$str]);
}
$time4 = microtime(true);

echo '新方法:'.($time4-$time3);

结果:

原始方法:2.9000020027161
新方法:0.008030891418457
php
本作品采用《CC 协议》,转载必须注明作者和本文链接
本帖由系统于 5年前 自动加精
jiangjun
《L05 电商实战》
从零开发一个电商项目,功能包括电商后台、商品 & SKU 管理、购物车、订单管理、支付宝支付、微信支付、订单退款流程、优惠券等
《L03 构架 API 服务器》
你将学到如 RESTFul 设计风格、PostMan 的使用、OAuth 流程,JWT 概念及使用 和 API 开发相关的进阶知识。
讨论数量: 10

array_flip 的源码:
file

array_search 的部分源码:

file

可以看到都是通过 foreach 遍历,而 array_search 可能只遍历到一半就退出了,array_flip 每次一定是全都遍历完。

至于为什么 n (n> 1) 次的时候 array_flip 会快,是因为 array_flip 只需要遍历一次数组,array_search 却需要遍历 n 次

5年前 评论
panda-sir

isset 走的 hash 表吧 查找时间复杂度为 O(1)

5年前 评论
jiangjun (楼主) 5年前

这样的话就要把 array_flip 的执行时间也算上吧。

5年前 评论
jiangjun (楼主) 5年前
aszx0413

好奇得多大的数组才会引起 in_array 查询慢

5年前 评论
Michael_21 5年前

in_array 建议加上第三个参数 in_array (...,true) 强类型对比,效率会提升不少

5年前 评论
阿麦

感谢分享

5年前 评论

作者确定吗 ? 测试了一下 array_search 和 in_array 都耗时很短 反而最耗时得是 array_flip

5年前 评论
jiangjun (楼主) 5年前

array_flip 的源码:
file

array_search 的部分源码:

file

可以看到都是通过 foreach 遍历,而 array_search 可能只遍历到一半就退出了,array_flip 每次一定是全都遍历完。

至于为什么 n (n> 1) 次的时候 array_flip 会快,是因为 array_flip 只需要遍历一次数组,array_search 却需要遍历 n 次

5年前 评论

array_search 的单次耗时确实比 array_flip 快的多,但这个优化案例比的就不是这两个函数的速度了,真实场景遇到的不多。

5年前 评论

这种比较意义不大

5年前 评论