PHP array_search 和 in_array 函数效率问题

问题

在一个接口中,发现非常耗时,排查原因发现array_search查找数组中的元素的key时,效率随着数组变大,耗时增加。特别是大数组时,非常耗时。在函数in_array也有这个问题。

解决办法

采用array_flip翻转后,用isset代替in_array函数,用$array[key] 替代array_search,这样能解决大数组超时耗时问题

下面是我从php官网抄下来的笔记,可以观察这两个方法效率的差异
原网址https://www.php.net/manual/en/function.in-...

If you're working with very large 2 dimensional arrays (eg 20,000+ elements) it's much faster to do this...

$needle = 'test for this';

$flipped_haystack = array_flip($haystack);

if ( isset($flipped_haystack[$needle]) )
{
  print "Yes it's there!";
}

I had a script that went from 30+ seconds down to 2 seconds (when hunting through a 50,000 element array 50,000 times).

Remember to only flip it once at the beginning of your code though!

--------------------2019-10-14更新----------------------

更正

有人提出意见说道,array_flip效率比in_arrayarray_search高,做了一些实验,确实如此。这点是我原来没有考虑到问题。这个解决办法,适用于多次使用in_arrayarray_search函数,才有效。下面是自己做实验的结果。感谢@木偶指出的问题

<?php
$array = array();

for ($i=0; $i<200000; $i++){
    ##随机字符串
    $array[$i] = get_rand().$i;
}

$str = $array[150000];
$time1 = microtime(true);
array_search($str, $array);
$time2 = microtime(true);
echo '原始方法:'.($time2-$time1)."\n";

$time3 =  microtime(true);
$new_array = array_flip($array);
isset($new_array[$str]);
$time4 = microtime(true);
echo '新方法:'.($time4-$time3);

结果:

原始方法:0.0010008811950684
新方法:0.0069980621337891

循环5000次

$array = array();

for ($i=0; $i<200000; $i++){
    ##随机字符串
    $array[$i] = get_rand().$i;
}

$str = $array[199999];
$time1 = microtime(true);
for ($i=0; $i<5000; $i++){
    array_search($str, $array);
}
$time2 = microtime(true);

echo '原始方法:'.($time2-$time1)."\n";

$time3 =  microtime(true);
$new_array = array_flip($array);
for ($i=0; $i<5000; $i++){
    isset($new_array[$str]);
}
$time4 = microtime(true);

echo '新方法:'.($time4-$time3);

结果:

原始方法:2.9000020027161
新方法:0.008030891418457
php
本帖已被设为精华帖!
本帖由系统于 4天前 自动加精
jiangjun
《L01 基础入门》
我们将带你从零开发一个项目并部署到线上,本课程教授 Web 开发中专业、实用的技能,如 Git 工作流、Laravel Mix 前端工作流等。
《L02 从零构建论坛系统》
以构建论坛项目 LaraBBS 为线索,展开对 Laravel 框架的全面学习。应用程序架构思路贴近 Laravel 框架的设计哲学。
讨论数量: 7
panda-sir

isset走的hash表吧 查找时间复杂度为O(1)

5天前 评论
jiangjun (楼主) 5天前

这样的话就要把 array_flip 的执行时间也算上吧。

5天前 评论
jiangjun (楼主) 9小时前
aszx0413

好奇得多大的数组才会引起 in_array 查询慢

5天前 评论

in_array 建议加上第三个参数 in_array(...,true) 强类型对比,效率会提升不少

4天前 评论
GhostCoder

感谢分享

4天前 评论

作者确定吗 ? 测试了一下 array_search 和 in_array 都耗时很短 反而最耗时得是 array_flip

10小时前 评论
jiangjun (楼主) 9小时前

请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!