1.2. 信息:查询和分词

未匹配的标注

你可以快速使用Elasticsearch去存储文档并且能够去检索文档、元数据,是因为它的强大能力是基于Apache Lucene搜索引擎库所构建的全套搜索功能。

Elasticsearch提供了一个简单、连贯的REST API用于管理集群、索引和搜索数据。出于在测试的目的,你可以直接通过命令行或者Kibana中的开发者控制台中很轻松提交请求。在自己的应用程序中,你可以将 Elasticsearch客户端用于自己选择的语言:Java, JavaScript, Go, .NET, PHP, Perl, Python or Ruby.

搜索数据:
Elasticsearch REST API支持结构化查询、全文本查询和结合这两种查询的复杂查询。结构化查询类似于SQL中构造的查询类型。例如你可以在员工索引中搜索"gender"和"age"字段,然后按照"hire_date"字段进行排序。全文查询会查找跟查询字符串匹配的所有文档,并返回按相关性排序的文档 -它们与你的搜索词的匹配程度如何

除了搜索单个字段外,还可以执行短语搜索,相似性搜索和前缀搜索,并返回自动匹配建议。

是否有搜索地理空间或者其他数字类型数据的需求?Elasticsearch在优化的数据结构中索引非文本数据,这些数据结构支持高性能地理和数字查询。

你可以使用Elasticsearch的综合JSON查询语言(Query DSL)访问所有这些搜索功能,还可以构造SQL样式的查询,以便在Elasticsearch内部以本机方式搜索和聚合数据,并且JDBC和ODBC驱动允许广泛的第三方应用程序通过SQL与Elasticsearch进行交互。

分析数据:
Elasticsearch聚合API使你能够构建数据的复杂摘要,并深入了解关键指标,模式和趋势。通过聚合不仅可以找到俗话说的“大海捞针”,还可以让您回答以下问题:

大海捞针能有多少根?

针的平均长度是多少?

按制造商分类的针的中间长度是多少?

在过去的六个月中,大海捞针的数量是多少?

(PS:个人理解就是 问你是否能清楚自己的数据的详细值)

您还可以使用聚合来回答更细微的问题,例如:
您最受欢迎的针头制造商是哪些?
是否有异常或异常的针团?
由于聚合利用了用于搜索的相同数据结构,因此它们也非常快。这使您可以实时分析和可视化数据。您的报告和仪表板会随着数据的更改而更新,因此您可以根据最新信息采取措施。

重要的是,汇总通常跟搜索请求一起运行。您可以在单个请求中同时对相同数据进行文档搜索,过滤结果并执行分析。而且由于聚合是在特定搜索的上下文中计算的,因此您不仅显示了所有70针大小的针数,而且还显示了符合用户搜索条件的70针大小的针数-例如,所有尺寸的70个不粘绣针。

结尾

是否更多人想的是自动分析时间序列数据?
你可以使用机器学习功能创建数据中正常行为准确基线,并识别异常模式。使用机器学习,你可以检测到:

  • 异常的值、计算 或者频率的时间偏差
  • 统计
  • 异常的行为

最棒的是你无需指定算法,模型或其他与数据科学相关的配置!

本文章首发在 LearnKu.com 网站上。

本译文仅用于学习和交流目的,转载请务必注明文章译者、出处、和本文链接
我们的翻译工作遵照 CC 协议,如果我们的工作有侵犯到您的权益,请及时联系我们。
上一篇 下一篇
CrazyZard
贡献者:3
讨论数量: 0
发起讨论 只看当前版本


暂无话题~