笔记六十：提升集群读性能

CrazyZard 的个人博客 / 43 / 2 / 创建于 4年前 / 更新于 4年前

尽量 Denormalize 数据

Elasticsearch ！= 关系型数据库
尽可能 Denormalize 数据，从而获取最佳的性能
- 使用 Nested 类型的数据。查询速度会慢几倍
- 使用 Parent / Child 关系。查询速度会慢几百倍

数据建模

尽量将数据先行计算，然后保存到 Elasticsearch 中。尽量避免查询时的 Script 计算
尽量使用 Filter Context，利用缓存机制，减少不必要的算分
结合 profile，explain API 分析慢查询的问题，持续优化数据模型
- 严禁使用 * 开头通配符 Terms 查询

避免查询时脚本

可以在 Index 文档时，使用 Ingest Pipeline，计算并写入某个字段

集群读性能优化

常见的查询性能问题 - 使用 Query Context

集群读性能优化

聚合文档消耗内存

聚合查询会消耗内存，特别是针对很大的数据集进行聚合运算
- 如果可以控制聚合的数量，就能减少内存的开销
当需要使用不同的 Query Scope，可以使用 Filter Bucket

集群读性能优化

通配符开始的正则表达

通配符开头的正则，性能非常糟糕，需避免使用

集群读性能优化

优化分片

避免 Over Sharing
- 一个查询需要访问每一个分片，分片过多，会导致不必要的查询开销
结合应用场景，控制单个分片的尺寸
- Search： 20GB
- Logging：40GB
Force-merge Read-only 索引
- 使用基于时间序列的索引，将只读的索引进行 force merge，减少 segment 数

读性能优化

影响查询性能的一些因素
- 数据模型和索引配置是否优化
- 数据规模是否过大，通过 Filter 减少不必要的数据计算
- 查询语句是否优化

本作品采用《CC 协议》，转载必须注明作者和本文链接

快乐就是解决一个又一个的问题！

版主 1.3k 声望

程序猿 @ 西湖心辰

暂无个人描述~

讨论数量: 2

panglongxia

6 声望

集群压力测试这一章没有

4年前评论

panglongxia

6 声望

你是有课堂的ppt 吗？

4年前评论

CrazyZard （楼主）

在github 上

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

程序猿 @ 西湖心辰

私信

文章归档

1 篇 2023 年 8 月 1 篇 2023 年 3 月 1 篇 2022 年 11 月 1 篇 2021 年 12 月 1 篇 2021 年 8 月 1 篇 2021 年 7 月 1 篇 2021 年 2 月 1 篇 2021 年 1 月 1 篇 2020 年 10 月 1 篇 2020 年 9 月 1 篇 2020 年 8 月 7 篇 2020 年 7 月 7 篇 2020 年 6 月 1 篇 2020 年 5 月 6 篇 2020 年 4 月 11 篇 2020 年 3 月 13 篇 2020 年 2 月 8 篇 2020 年 1 月 16 篇 2019 年 12 月 13 篇 2019 年 11 月 22 篇 2019 年 10 月 2 篇 2019 年 9 月 1 篇 2018 年 12 月

8个月前如何正确计算 openai stream 流式的 tokens 1年前 mysql 同步 es 详细步骤讲解 1年前在 mapping 上新建索引字段，更新全部文档，随后发现这个好用的功能 2年前 0 == "无". 结果是 true 2年前 golang 的 http 请求池

66 连 TCP 这几个参数都不懂，回去等通知吧！（一） 58 世界上最好的学习法：费曼学习法 56 七大缓存经典问题 31 吃透了这些 Redis 知识点，面试官一定觉得你很 NB 18 基于 swoole 的laravel 聊天平台

博客标签

成为赞助商