PHP array_search 和 in_array 函数效率问题
问题
在一个接口中,发现非常耗时,排查原因发现array_search
查找数组中的元素的key时,效率随着数组变大,耗时增加。特别是大数组时,非常耗时。在函数in_array
也有这个问题。
解决办法
采用array_flip
翻转后,用isset
代替in_array
函数,用$array[key]
替代array_search
,这样能解决大数组超时耗时问题
下面是我从php官网抄下来的笔记,可以观察这两个方法效率的差异
原网址:https://www.php.net/manual/en/function.in-...
If you're working with very large 2 dimensional arrays (eg 20,000+ elements) it's much faster to do this...
$needle = 'test for this';
$flipped_haystack = array_flip($haystack);
if ( isset($flipped_haystack[$needle]) )
{
print "Yes it's there!";
}
I had a script that went from 30+ seconds down to 2 seconds (when hunting through a 50,000 element array 50,000 times).
Remember to only flip it once at the beginning of your code though!
--------------------2019-10-14更新----------------------
更正
有人提出意见说道,array_flip
效率比in_array
和array_search
高,做了一些实验,确实如此。这点是我原来没有考虑到问题。这个解决办法,适用于多次使用in_array
和array_search
函数,才有效。下面是自己做实验的结果。感谢@木偶指出的问题
<?php
$array = array();
for ($i=0; $i<200000; $i++){
##随机字符串
$array[$i] = get_rand().$i;
}
$str = $array[150000];
$time1 = microtime(true);
array_search($str, $array);
$time2 = microtime(true);
echo '原始方法:'.($time2-$time1)."\n";
$time3 = microtime(true);
$new_array = array_flip($array);
isset($new_array[$str]);
$time4 = microtime(true);
echo '新方法:'.($time4-$time3);
结果:
原始方法:0.0010008811950684
新方法:0.0069980621337891
循环5000次
$array = array();
for ($i=0; $i<200000; $i++){
##随机字符串
$array[$i] = get_rand().$i;
}
$str = $array[199999];
$time1 = microtime(true);
for ($i=0; $i<5000; $i++){
array_search($str, $array);
}
$time2 = microtime(true);
echo '原始方法:'.($time2-$time1)."\n";
$time3 = microtime(true);
$new_array = array_flip($array);
for ($i=0; $i<5000; $i++){
isset($new_array[$str]);
}
$time4 = microtime(true);
echo '新方法:'.($time4-$time3);
结果:
原始方法:2.9000020027161
新方法:0.008030891418457
本作品采用《CC 协议》,转载必须注明作者和本文链接
高认可度评论:
array_flip的源码:

array_search的部分源码:
可以看到都是通过foreach遍历,而array_search可能只遍历到一半就退出了,array_flip每次一定是全都遍历完。
至于为什么n(n > 1)次的时候array_flip会快,是因为array_flip只需要遍历一次数组,array_search却需要遍历n次
好办法
isset
走的hash
表吧 查找时间复杂度为O(1)
这样的话就要把 array_flip 的执行时间也算上吧。
好奇得多大的数组才会引起 in_array 查询慢
in_array 建议加上第三个参数 in_array(...,true) 强类型对比,效率会提升不少
感谢分享
作者确定吗 ? 测试了一下 array_search 和 in_array 都耗时很短 反而最耗时得是 array_flip
array_flip的源码:

array_search的部分源码:
可以看到都是通过foreach遍历,而array_search可能只遍历到一半就退出了,array_flip每次一定是全都遍历完。
至于为什么n(n > 1)次的时候array_flip会快,是因为array_flip只需要遍历一次数组,array_search却需要遍历n次
array_search 的单次耗时确实比 array_flip 快的多,但这个优化案例比的就不是这两个函数的速度了,真实场景遇到的不多。
这种比较意义不大