Elasticsearch内部结构简介

💡 原文中文,约2500字,阅读约需6分钟。
📝

内容提要

Elasticsearch是企业搜索的领先解决方案之一,它基于Lucene库实现全文索引。Elasticsearch提供了Lucene库所缺少的重要功能,如托管、基于JSON的REST API和缓存。索引分布在主分片和副本分片中,每个搜索文档都有评分。Elasticsearch使用Okapi BM25算法确定相关性得分,并平衡集群中的分片数量。添加新节点时可以使用组播地址或单播,冲突处理机制是通过乐观锁定实现的。分片数量应根据规划确定,避免将大量数据放在单个索引中。索引请求和搜索请求分别经过协调节点处理。Elasticsearch节点由不同模块组成,如发现和集群形成、HTTP、插件、线程池和传输。Elasticsearch的开源版本可以从官方Github repo获取。

🎯

关键要点

  • Elasticsearch是企业搜索的领先解决方案之一,基于Lucene库实现全文索引。
  • Elasticsearch提供托管、基于JSON的REST API和缓存等功能。
  • 索引分布在主分片和副本分片中,每个搜索文档都有评分。
  • 使用Okapi BM25算法确定相关性得分,平衡集群中的分片数量。
  • 添加新节点时可使用组播地址或单播,冲突处理通过乐观锁定实现。
  • 分片数量应根据规划确定,避免将大量数据放在单个索引中。
  • 索引请求和搜索请求分别经过协调节点处理。
  • Elasticsearch节点由不同模块组成,如发现和集群形成、HTTP、插件、线程池和传输。
  • Elasticsearch的开源版本可以从官方Github repo获取。
🏷️

标签

➡️

继续阅读