笔记十五：聚合分析简介

CrazyZard 的个人博客 / 3 / 0 / 创建于 6年前 / 更新于 6年前

聚合（Aggregation）

Elasticsearch除搜索以外，提供的针对ES数据进行统计分析的功能
- 实时性
- Hadoop (T+1)
通过聚合，我们会得到一个数据的概念，是分析和总结全套的数据，而不是寻找单个文档
- 尖沙咀和香港岛的客房数量
- 不同的价格区间，可预定的经济型酒店和五星级酒店的数量
高性能，只需要一条语句，就可以从ES得到分析结果
- 无需再客户端自己去实现分析逻辑

Kibana 可视化报表

集合的分类

Bucket Aggregation - 一些列满足特定条件的文档的集合
Metric Aggregation - 一些数学运算，可以对文档字段进行统计分析
Pipeline Aggregation - 对其他的聚合结果进行二次聚合
Matrix Aggregation - 支持对多个字段的操作并提供一个结果矩阵

Bucket & Metric

Metric - 一些系统的统计方法（类似 count）
Bucket - 一组满足条件的文档（group by）

Bucket

一些例子
- 杭州属于浙江 / 演员是男或女
- 嵌套关系 - 杭州属于浙江属于中国属于亚洲
ES 提供了许多的类型的Bucket，帮助用多种方式划分文档
- Tern & Range (时间 / 年龄区间 / 地理位置)

Metric

Metric 会基于数据集计算结果，除了支持在字段上进行计算，同样也支持在脚本（painless script）产生的结果之上进行计算
大多数Metric是数学计算，仅输出一个值
- min / max / sum / avg /cardinality
部分metric 支持输出多个数值
- stats / percentiles / percentile_ranks

Demo

ES 笔记十五：聚合分析简介

ES 笔记十五：聚合分析简介

ES 笔记十五：聚合分析简介

es

本作品采用《CC 协议》，转载必须注明作者和本文链接

快乐就是解决一个又一个的问题！

版主 1.3k 声望

程序猿 @ 西湖心辰

暂无个人描述~

讨论数量: 0

(=￣ω￣=)··· 暂无内容！

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

程序猿 @ 西湖心辰

私信

文章归档

1 篇 2023 年 8 月 1 篇 2023 年 3 月 1 篇 2022 年 11 月 1 篇 2021 年 12 月 1 篇 2021 年 8 月 1 篇 2021 年 7 月 1 篇 2021 年 2 月 1 篇 2021 年 1 月 1 篇 2020 年 10 月 1 篇 2020 年 9 月 1 篇 2020 年 8 月 7 篇 2020 年 7 月 7 篇 2020 年 6 月 1 篇 2020 年 5 月 6 篇 2020 年 4 月 11 篇 2020 年 3 月 13 篇 2020 年 2 月 8 篇 2020 年 1 月 16 篇 2019 年 12 月 13 篇 2019 年 11 月 22 篇 2019 年 10 月 2 篇 2019 年 9 月 1 篇 2018 年 12 月

2年前如何正确计算 openai stream 流式的 tokens 3年前 mysql 同步 es 详细步骤讲解 3年前在 mapping 上新建索引字段，更新全部文档，随后发现这个好用的功能 4年前 0 == "无". 结果是 true 4年前 golang 的 http 请求池

66 连 TCP 这几个参数都不懂，回去等通知吧！（一） 58 世界上最好的学习法：费曼学习法 56 七大缓存经典问题 31 吃透了这些 Redis 知识点，面试官一定觉得你很 NB 18 基于 swoole 的laravel 聊天平台

博客标签

成为赞助商