笔记三十二：文档分布式存储

CrazyZard 的个人博客 / 0 / 0 / 创建于 6年前 / 更新于 6年前

文档储存在分片上

文档会存储在具体的某个主分片和副本分片上：例如文档1，会储存在P0 R0分片上
文档到分片的映射算法
- 确保文档能均匀分布在所用分片上，充分利用硬件资源，避免部分机器空闲，部门机器繁忙
- 潜在的算法
  - 随机/Round Robin.当查询文档1，分片数很多，需要多次查询才能查档文档1
  - 维护文档到分片的映射关系，当文档数据量大的时候，维护成本高
  - 实时计算，通过文档1，自动算出，需要去哪个分片上获取文档

文档到分片的路由算法

shard = hash(_routing) % number_of_primary_shards
- Hash 算法确保文档均匀分散到分片中
- 默认的_routing 值是文档id
- 可以自行制定routing数值，例如用相同国家的商品，都分配到制定的shard
- 设置Index Setting 后，Primary 数，不能随意修改的根本原因

更新文档

顺序： index -> hash -> route -> delete -> index -> success -> response

ES 笔记三十二：文档分布式存储

删除一个文档

顺序：detele -> hash&route -> delete -> delete replica -> success -> deleted -> response

ES 笔记三十二：文档分布式存储

总结

可以设置Index Settings ，控制数据的分片
Primary Shard 的值不能修改，修改需要重新Index。默认值是5，从版本7开始，默认值为1
索引写入数据后，Replica值可以修改。增加副本，可提高大并发下的读取性能
通过控制集群的节点数，设置Primary Shard 数，实现水平扩展

本作品采用《CC 协议》，转载必须注明作者和本文链接

快乐就是解决一个又一个的问题！

版主 1.3k 声望

程序猿 @ 西湖心辰

暂无个人描述~

讨论数量: 0

(=￣ω￣=)··· 暂无内容！

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

程序猿 @ 西湖心辰

私信

文章归档

1 篇 2023 年 8 月 1 篇 2023 年 3 月 1 篇 2022 年 11 月 1 篇 2021 年 12 月 1 篇 2021 年 8 月 1 篇 2021 年 7 月 1 篇 2021 年 2 月 1 篇 2021 年 1 月 1 篇 2020 年 10 月 1 篇 2020 年 9 月 1 篇 2020 年 8 月 7 篇 2020 年 7 月 7 篇 2020 年 6 月 1 篇 2020 年 5 月 6 篇 2020 年 4 月 11 篇 2020 年 3 月 13 篇 2020 年 2 月 8 篇 2020 年 1 月 16 篇 2019 年 12 月 13 篇 2019 年 11 月 22 篇 2019 年 10 月 2 篇 2019 年 9 月 1 篇 2018 年 12 月

2年前如何正确计算 openai stream 流式的 tokens 3年前 mysql 同步 es 详细步骤讲解 3年前在 mapping 上新建索引字段，更新全部文档，随后发现这个好用的功能 4年前 0 == "无". 结果是 true 4年前 golang 的 http 请求池

66 连 TCP 这几个参数都不懂，回去等通知吧！（一） 58 世界上最好的学习法：费曼学习法 56 七大缓存经典问题 31 吃透了这些 Redis 知识点，面试官一定觉得你很 NB 18 基于 swoole 的laravel 聊天平台

博客标签

成为赞助商