该 sql 语句在生产环境执行需要 50s，如何改进它

问答 / 0 / 13 / 创建于 5年前 / 更新于 5年前

SELECT
`a`.* 
FROM
`cs_goods` AS `a` 
WHERE
( SELECT COUNT(`b`.`id`)  FROM `cs_goods` AS b WHERE `b`.`cs_merchant_id` = `a`.`cs_merchant_id` AND `b`.`created_at` > `a`.`created_at` AND `status` = 1 and `audit_status` = 2 and `sq_type` <> 3 ) < 3
AND `status` = 1 and `audit_status` = 2 and `sq_type` <> 3 
ORDER BY
`a`.`created_at` DESC LIMIT 100;

cs_goods 表结构：

id	cs_merchant_id	goods_name	status	audit_status	sq_type	created_at	updated_at
1	10000	测试商品1	1	2	2	2019-08-01 19:35:06	2019-08-03 09:54:32
2	10000	测试商品2	1	2	2	2019-08-01 19:35:06	2019-08-03 09:54:32

需求：拿到 cs_goods 表中最新的 100 个商品（按 created_at 倒序），且每个超市的商品不能超过 3 个（cs_merchant_id 是超市）
也就是一共需要拿到 100 个商品，但是每个超市不能超过 3 个。

laravel mysql

一个人的江湖

Laravel 8.x 译者 345 声望

开发 @ 一个人的江湖

暂无个人描述~

1 人点赞

从小程序个人账户申请开始，带你一步步进行开发一个微信小程序，直到提交微信控制台上线发布。

你将学到如 RESTFul 设计风格、PostMan 的使用、OAuth 流程，JWT 概念及使用和 API 开发相关的进阶知识。

推荐文章：

更多推荐...

博客

用 Laravel12 Startkit 做了一个 composer 私有包托管平台 😂 点赞超过 20 个开源，看看需要的人多不多 28 / 19 |

博客

花了四个月打磨的 Laravel Plus 开源 31 / 98 |

博客

冯老师的困惑 —— 一个跑了两年的 BUG 21 / 17 |

试用 Laravel + 树莓派搭建视频监控，并支持线上访问 27 / 19 |

博客

在laravel下实现全双工的websocket开发 21 / 9 |

分享创造

无需修改任何代码和扩展将你的Laravel项目性能提高20倍 101 / 100 |

一个人的江湖

Laravel 8.x 译者 345 声望 / 开发 @ 一个人的江湖

最佳答案

在无法改变原有需求的前提下，又要考虑性能问题，

可以考虑降低数据基数，取最新的 1000 条数据来进行处理，

这样就比操作整张表的效率要高很多很多，压力也比较小

以下是正确的 sql，执行时间 0.111s

select a.id,a.cs_merchant_id,a.created_at,a.rank,a.status,a.audit_status,a.sq_type from 
( select b.*,@rownum:=@rownum+1,if(@id=b.cs_merchant_id,@rank:=@rank+1,@rank:=1) as rank, @id:=b.cs_merchant_id 
   from  (select g.* from cs_goods g where g.status = 1 and g.audit_status = 2 and g.sq_type <> 3 order by g.created_at desc limit 1000) b, 
         (select @rownum:=0 , @id:=null ,@rank:=0) c 
      order by b.cs_merchant_id,b.id desc 
) a having a.rank <4 order by a.created_at desc limit 100;

执行结果图：

file

5年前评论

讨论数量: 13

wanghan

课程读者 105 声望 / PHP开发工程师 @ 无组织

explain就能看出哪里慢了

5年前评论

wanghan

课程读者 105 声望 / PHP开发工程师 @ 无组织

把explain结果贴出来看看

5年前评论

一个人的江湖

Laravel 8.x 译者 345 声望 / 开发 @ 一个人的江湖

file @wanghan

5年前评论

_杭城浪子

没命中索引而且全表扫描了

wanghan

课程读者 105 声望 / PHP开发工程师 @ 无组织

才这么点数据，50秒不至于吧，想办法让a表用到索引就完美解决了

5年前评论

一个人的江湖（楼主）

这条语句只用到了一张表 cs_goods 表

一个人的江湖（楼主）

数据确实不多，才70000+

好人二狗

课程读者 22 声望 / PHP @ 不可描述

能说一下需求么，我感觉你这个查的东西是不用这样写的，像是简单的需求，SQL写的很复杂

5年前评论

好人二狗（作者）

比如说我没明白你这个统计的意义，你这个子查询是针对整表的统计，写它<3的目的是啥。

一个人的江湖（楼主）

需求是要拿到 cs_goods 表中最新的 100 个商品，每个超市的商品不能超过 3 个

一个人的江湖（楼主）

表结构和需求放到问题中了

课程读者 82 声望 / CTO @ 易拓科技

表A 全表了

`status` = 1 and `audit_status` = 2 and `sq_type` <> 3

做下组合索引
先看看效果，还慢就优化子查询

5年前评论

Sparkfly

265 声望 / 全栈开发 @ .

SELECT
    `a`.* 
FROM
    `cs_goods` AS `a` 
LEFT JOIN `cs_goods` AS `b` 
ON 
    `a`.cs_merchant_id = `b`.cs_merchant_id
    AND 
    `b`.`created_at` > `a`.`created_at`
GROUP BY
    `a`.id
    `a`.cs_merchant_id
    `a`.created_at
HAVING
    count(`b`.id) <= 3
ORDER BY
    `a`.`created_at` DESC LIMIT 100;

5年前评论

一个人的江湖（楼主）

请问，status = 1 and audit_status = 2 and sq_type <> 3 应该加在什么地方

Sparkfly （作者）

@一个人的江湖 ON xxx AND xxx

ChenRuihua

@一个人的江湖可以反馈一下用答主的这个写法，查询速度是多少么？

一个人的江湖（楼主）

1分04秒，和之前没什么差别，有时候还会直接崩溃

aodaobi

课程读者 44 声望 / php菜鸟 @ 擼代碼的地里人

file

5年前评论

aodaobi

课程读者 44 声望 / php菜鸟 @ 擼代碼的地里人

不建议使用 SELECT * 类型查询
Item: COL.001

Severity: L1

Content: 当表结构变更时，使用 * 通配符选择所有列将导致查询的含义和行为会发生更改，可能导致查询返回更多的数据。

避免在 WHERE 条件中使用函数或其他运算符
Item: FUN.001

Severity: L2

Content: 虽然在 SQL 中使用函数可以简化很多复杂的查询，但使用了函数的查询无法利用表中已经建立的索引，该查询将会是全表扫描，性能较差。通常建议将列名写在比较运算符左侧，将查询过滤条件放在比较运算符右侧。也不建议在查询比较条件两侧书写多余的括号，这会对阅读产生比较大的困扰。

同一张表被连接两次
Item: JOI.002

Severity: L4

Content: 相同的表在 FROM 子句中至少出现两次，可以简化为对该表的单次访问。

MySQL 对子查询的优化效果不佳
Item: SUB.001

Severity: L4

Content: MySQL 将外部查询中的每一行作为依赖子查询执行子查询。这是导致严重性能问题的常见原因。这可能会在 MySQL 5.6 版本中得到改善, 但对于5.1及更早版本, 建议将该类查询分别重写为 JOIN 或 LEFT OUTER JOIN。

不建议在子查询中使用函数
Item: SUB.006

Severity: L2

Content: MySQL将外部查询中的每一行作为依赖子查询执行子查询，如果在子查询中使用函数，即使是semi-join也很难进行高效的查询。可以将子查询重写为OUTER JOIN语句并用连接条件对数据进行过滤。

5年前评论

lchola

这个分析很六是有什么工具么

aodaobi （作者）

@lchola 小米开源的soar

馨竹之乡

23 声望

select tmp., count(tmp1.cs_merchant_id) num from (select from cs_goods where status = 1 and audit_status = 2 and sq_type <> 3 order by created_at desc) tmp join cs_goods tmp1 on tmp.id = tmp1.id group by tmp.cs_merchant_id having count(tmp1.cs_merchant_id) <= 3 limit 100

5年前评论

一个人的江湖

Laravel 8.x 译者 345 声望 / 开发 @ 一个人的江湖

在无法改变原有需求的前提下，又要考虑性能问题，

可以考虑降低数据基数，取最新的 1000 条数据来进行处理，

这样就比操作整张表的效率要高很多很多，压力也比较小

以下是正确的 sql，执行时间 0.111s

select a.id,a.cs_merchant_id,a.created_at,a.rank,a.status,a.audit_status,a.sq_type from 
( select b.*,@rownum:=@rownum+1,if(@id=b.cs_merchant_id,@rank:=@rank+1,@rank:=1) as rank, @id:=b.cs_merchant_id 
   from  (select g.* from cs_goods g where g.status = 1 and g.audit_status = 2 and g.sq_type <> 3 order by g.created_at desc limit 1000) b, 
         (select @rownum:=0 , @id:=null ,@rank:=0) c 
      order by b.cs_merchant_id,b.id desc 
) a having a.rank <4 order by a.created_at desc limit 100;

执行结果图：

file

5年前评论

颠倒的玉石

课程读者 166 声望 / 技术小垃圾 @ 山西证券

谁和我一样，有答案都看不懂 :sob: :sob: :sob: :sob:

5年前评论

JohnZhang

Laravel 8.x 译者 19 声望 / 执行董事 @ 南京方糖智行网络科技有限公司

其实我觉得另一个比较好的操作是去缓存结果，假如结果无法继续优化了可以尝试redis缓存。比如我们NOJ的热门小组，其实就是一分钟缓存一次的。这样有、高并发情况下并不会出现多个人运算多次的问题，可以减轻服务器负担。

5年前评论

一个人的江湖（楼主）

有打算用 redis 缓存数据，抛开 redis ，如果以您的角度来设计的话，您会怎么做这个需求，有什么其他的思路吗，比如更改表结构什么的

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

该 sql 语句在生产环境执行需要 50s，如何改进它

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

该 sql 语句在生产环境执行需要 50s，如何改进它

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录