PHP array_search 和 in_array 函数效率问题

问题

在一个接口中,发现非常耗时,排查原因发现array_search查找数组中的元素的key时,效率随着数组变大,耗时增加。特别是大数组时,非常耗时。在函数in_array也有这个问题。

解决办法

采用array_flip翻转后,用isset代替in_array函数,用$array[key] 替代array_search,这样能解决大数组超时耗时问题

下面是我从php官网抄下来的笔记,可以观察这两个方法效率的差异
原网址https://www.php.net/manual/en/function.in-...

If you're working with very large 2 dimensional arrays (eg 20,000+ elements) it's much faster to do this...

$needle = 'test for this';

$flipped_haystack = array_flip($haystack);

if ( isset($flipped_haystack[$needle]) )
{
  print "Yes it's there!";
}

I had a script that went from 30+ seconds down to 2 seconds (when hunting through a 50,000 element array 50,000 times).

Remember to only flip it once at the beginning of your code though!

--------------------2019-10-14更新----------------------

更正

有人提出意见说道,array_flip效率比in_arrayarray_search高,做了一些实验,确实如此。这点是我原来没有考虑到问题。这个解决办法,适用于多次使用in_arrayarray_search函数,才有效。下面是自己做实验的结果。感谢@木偶指出的问题

<?php
$array = array();

for ($i=0; $i<200000; $i++){
    ##随机字符串
    $array[$i] = get_rand().$i;
}

$str = $array[150000];
$time1 = microtime(true);
array_search($str, $array);
$time2 = microtime(true);
echo '原始方法:'.($time2-$time1)."\n";

$time3 =  microtime(true);
$new_array = array_flip($array);
isset($new_array[$str]);
$time4 = microtime(true);
echo '新方法:'.($time4-$time3);

结果:

原始方法:0.0010008811950684
新方法:0.0069980621337891

循环5000次

$array = array();

for ($i=0; $i<200000; $i++){
    ##随机字符串
    $array[$i] = get_rand().$i;
}

$str = $array[199999];
$time1 = microtime(true);
for ($i=0; $i<5000; $i++){
    array_search($str, $array);
}
$time2 = microtime(true);

echo '原始方法:'.($time2-$time1)."\n";

$time3 =  microtime(true);
$new_array = array_flip($array);
for ($i=0; $i<5000; $i++){
    isset($new_array[$str]);
}
$time4 = microtime(true);

echo '新方法:'.($time4-$time3);

结果:

原始方法:2.9000020027161
新方法:0.008030891418457
php
本作品采用《CC 协议》,转载必须注明作者和本文链接
本帖由系统于 3个月前 自动加精
jiangjun
《L02 从零构建论坛系统》
以构建论坛项目 LaraBBS 为线索,展开对 Laravel 框架的全面学习。应用程序架构思路贴近 Laravel 框架的设计哲学。
《L05 电商实战》
从零开发一个电商项目,功能包括电商后台、商品 & SKU 管理、购物车、订单管理、支付宝支付、微信支付、订单退款流程、优惠券等
讨论数量: 10

好办法

3个月前 评论
panda-sir

isset走的hash表吧 查找时间复杂度为O(1)

3个月前 评论
jiangjun (楼主) 3个月前

这样的话就要把 array_flip 的执行时间也算上吧。

3个月前 评论
jiangjun (楼主) 3个月前
aszx0413

好奇得多大的数组才会引起 in_array 查询慢

3个月前 评论
Michael_28 2个月前

in_array 建议加上第三个参数 in_array(...,true) 强类型对比,效率会提升不少

3个月前 评论
GhostCoder

感谢分享

3个月前 评论

作者确定吗 ? 测试了一下 array_search 和 in_array 都耗时很短 反而最耗时得是 array_flip

3个月前 评论
jiangjun (楼主) 3个月前

array_flip的源码:
file

array_search的部分源码:

file

可以看到都是通过foreach遍历,而array_search可能只遍历到一半就退出了,array_flip每次一定是全都遍历完。

至于为什么n(n > 1)次的时候array_flip会快,是因为array_flip只需要遍历一次数组,array_search却需要遍历n次

3个月前 评论

array_search 的单次耗时确实比 array_flip 快的多,但这个优化案例比的就不是这两个函数的速度了,真实场景遇到的不多。

3个月前 评论

这种比较意义不大

3个月前 评论

请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!