让 Laravel Scout 导入提速 64 倍

下一个版本的 Laravel Scout 将会使你的模型查询速度提升64倍。

我使用null scout 驱动测试了一张包含 1,632,576条数据的表。消耗的时间从过去的29分57秒缩短到了28秒。 ^[返回原文]^

你能在这里 查看提交的 pull request.

这篇文章解释了为什么代码中的这个更改会带来这么大的变化。这是我在我自己的 Laravel 应用中用来加速存在问题的查询的一个技巧。一旦你理解了它的原理,我打赌你会找到一种新的优化你的应用的方式。

背景

默认情况下, Scout 会检索数据库中的每一行。为了保持内存使用的合理性,它使用 chunk 方法 一次只取几百行。

chunk 方法为你的查询添加了限制和偏移量,像这样:

select * from `users` order by `id` asc limit 500 offset 500;

要获取下一页,偏移量会递增。

select * from `users` order by `id` asc limit 500 offset 1000;

首先这很好用,这个查询大约只需要大约一毫秒,但你走的越远,它就越慢。

一旦偏移量达到了 1,000,000 ,查询速度就会很容易慢 500 倍。当 Scout 导入执行数千个这样的查询时,它会累加起来。

为什么偏移量速度慢

当你使用偏移量时,你是在告诉数据库要跳过前 N 行。即使没有返回跳过的这些行,数据库仍然会从磁盘读取它们并对它们进行排序。

数据库 可能 能够使用索引并避免获取整个行。我们的示例查询中使用主键索引,但仍然可以抓取。

使 ChunkById 更快的分块

事实证明,不使用偏移量就可以很容易地对结果进行分页。我们所要做的就是跟踪我们看到的最后一个 ID ,然后过滤结果,以便只获取我们未见到的行。如果结果是按 ID 升序排序的,我们可以使用一个简单的 WHERE ID > :last_id 子句进行筛选。查询语句最终就会是像这样:

select * from `users` where `id` > :last_id order by `id` asc limit 500;

使用这种技术后,加载最后一页和第一页加载速度是一样快。

Laravel 让这毫不费力。不要调用 chunk 而是调用 chunkById 方法(在 5.2 中添加)。查询构造器将会添加 where 语句、 order by 和 limit 。

API 与 chunk 完全相同。只要你不使用任何自定义的 order by 子句,它就是 4 个字符的变化。


Practice makes perfect.

原文地址:https://mattallan.me/posts/making-larave...

译文地址:https://learnku.com/laravel/t/26935

《L02 从零构建论坛系统》
以构建论坛项目 LaraBBS 为线索,展开对 Laravel 框架的全面学习。应用程序架构思路贴近 Laravel 框架的设计哲学。
《L03 构架 API 服务器》
你将学到如 RESTFul 设计风格、PostMan 的使用、OAuth 流程,JWT 概念及使用 和 API 开发相关的进阶知识。
讨论数量: 1
lmaster

大赞,数据库是个需要我们好好学习研究的东西

2个月前 评论

请勿发布不友善或者负能量的内容。与人为善,比聪明更重要!

社区文档:

将托管在 packagist.org 和 github.com 的扩展包使用国内 CDN 加速
GitHub Laravel 扩展包 TOP 250
速查表方便快速查询框架功能,支持手机访问,支持中英文版本
Laravel 中文文档,由社区用户翻译和维护,将会保持一直更新
此文档的目的,就是为了提高技术团队的凝聚力、一致性和生产效率。
开发环境的部署,开发者工具的选择,适用于 Mac 和 Windows。
浓缩过后的精华
Laravel Nova 后台管理面板文档的中文翻译
Lumen 中文文档,由社区用户翻译和维护,将会保持一直更新
Laravel 下知名扩展包 Dingo API 的中文文档,Laravel API 开发必知必会