whereIn 大数据，内存占用问题

问答 / 10 / 21 / 创建于 3年前 / 更新于 3年前


// 取 order 表的部分符合条件的 uuid ，此处为简单示例直接取 all
$orderUUIDs = Order::all()->pluck('order_uuid');
 info('内存记录:'.memory_get_usage());
// 代码执行到下面这句内存溢出，实际使用时 $orderUUIDs 大概有十几万条
OrderFee::whereIn('order_uuid', $orderUUIDs)->sum('fee');

以上代码输出

[2022-07-27 18:36:02] production.INFO: 内存记录:51784224
[2022-07-27 18:36:02] production.ERROR: Allowed memory size of 134217728 bytes exhausted (tried to allocate 1052672 bytes) {"exception":"[object] (Symfony\\Component\\ErrorHandler\\Error\\FatalError(code: 0): Allowed memory size of 134217728 bytes exhausted (tried to allocate 1052672 bytes) at /apps/storage/20220720181003/vendor/laravel/framework/src/Illuminate/Collections/Arr.php:558)

问题：MySQL in 怎么这么耗内存，我只是取一个聚合结果

我未曾珍惜的，我不再拥有?‍?️

$model = Order::select('order_uuid'); $orders = Db::select($model->toSql(),$model->getBindings()); $orderUUIDs = array_column($orders,'order_uuid'); OrderFee::whereIn('order_uuid', $orderUUIDs)->sum('fee');

讨论数量: 21

哪吒的狗腿子

139 声望

$orderUUIDs 大概有十几万条 php不内存溢出、sql长度设置小了语句也会执行不了、wherein 十几万意义在哪

3年前评论

王小大

Laravel 9.x 译者 157 声望

如果用子查询呢

cevin

子查询或者 wherehas yyds

raybon

Laravel 8.x 译者 357 声望 / php @ 远程

如果有联合索引还好点，没索引全表扫描了

诺大的院子

课程读者 329 声望

一条SQL可以完成的没必要拆开来写，建议用Join连接查询

GeorgeKing

L5.7 译者 762 声望

这是架构设计上的问题了，这些数据可以通过定时任务或消息队列中去分析，这样可以将查询的任务拆分，不至于影响到其他业务。亦或是通过 MQ 将数据写入支持 OLAP 的一些数据库，如 Clickhouse。

wdnmd

课程读者 66 声望

wherein 如果数据过大还是用join把，不然你那么多数据传过去 mysql的tcp都顶不住

晏南风

哈哈哈哈这个导出没有用的wherein 我的天哪那个导出数据量 mysql 压力就很大

陈先生

课程读者 651 声望 / PHP_EOL @ NaN

按照楼主描述数据查出来十几万条数据, 楼层有人回答索引的问题, 殊不知在 in 一个非常大的范围的时候, 索引会无效. 我相对会建议 chunk + 索引.

jiangjun

72 声望 / php开发工程师 @ 红砖工厂

这是php内存爆了，不是mysql内存爆了。看情况mysql是返回了数据的。

taohua

课程读者 51 声望

建议 join

WmKong

课程读者 20 声望 / RD @ Baidu

这种大批量的数据建议不要在服务中实时计算，耗时太严重，可以通过定时任务刷新数据到缓存中，服务直接读取缓存中的数据

sanders

课程读者 648 声望 / 程序员鼓励师 @ KDD

OrderFee 先与 Order 建立模型关系，在使用 whereHas 进行查询。

markyanggang

19 声望

chunk

my38778570

772 声望

分段in

lyxxxh

1.3k 声望

优化

之所以转成原生DB,是因为model 很占用内存。

问题

这个错误属于php层

Order::all()->pluck('order_uuid')

(就算是为了演示,也不能这么写啊 Order::pluck('order_uuid') 都比这个好

十万条数据,就是10万个类

ps:我感觉不是whereIn问题,因为不科学。

lyxxxh （作者）

打脸了还真是 whereIn 问题。

见: stackoverflow.com/questions/153767...

解决

       $model = \App\Model\SingleOrder::select('id');
        dd(
            SingleOrder::whereIn('id',$model)->sum('unit_price')
        );

刚刚whereIn 十万条数据,等了很久都没反应。
搞个临时表就行了,几百毫秒可以统计出来。

周小云

课程读者 180 声望 / php @ php

奇奇怪怪的设计

杨柳岸

Laravel 8.x 译者 55 声望

where in 十几万太多了，建议数据写到统计表，查起来就快了。

Larva

57 声望

用子查询，这样不用取到PHP的内存里，然后PHP里用迭代器

青春不留白

课程读者 12 声望

优化一：

$uids = select order_uuid  from Order;

优化二：

collect($uids)->chunk(500)->map(function($item, $key){
        return OrderFee::whereIn('order_uuid', $item)->sum('fee');
})->sum();

定义为Command/消费金额统计命令，然后注册到任务调度里面去统计。
如果你直接实时的话，很容易阻塞worker进程无法响应nginx。

也可以使用chunkById这种方式，区别在于这种类似于命令行分页查询， where id > xxx limit 500运行。

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

whereIn 大数据，内存占用问题

推荐文章：

优化

问题

解决

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

whereIn 大数据，内存占用问题

推荐文章：

优化

问题

解决

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录