Elasticsearch 检索性能优化

💡 原文中文,约3000字,阅读约需7分钟。
📝

内容提要

ElasticSearch 是常用的全文检索数据库,优化查询性能可从索引设计、集群配置和查询三方面入手。索引优化包括设置 index:false、合理配置 shard 数和禁用动态映射。集群配置需明确节点角色并合理分配资源。查询优化建议显式设置返回字段、使用 filter 查询,避免一次性返回大集合。整体优化需综合考虑多个因素,具体问题具体分析。

🎯

关键要点

  • ElasticSearch 是常用的全文检索数据库,优化查询性能可从索引设计、集群配置和查询三方面入手。
  • 索引优化包括设置 index:false、合理配置 shard 数和禁用动态映射。
  • 设置 index:false 适用于没有检索和过滤需求的字段,实际数据仍会存储。
  • 合理配置 shard 数,避免过多 shard 导致的同步时间延长和资源消耗。
  • 禁用动态映射,使用确定的映射设计以提高性能。
  • 慎用复杂结构,nested 结构和 parent-child 结构会显著降低查询速度。
  • 使用 copy_to 将常组合搜索的字段合并,提升查询效率。
  • 预处理数据字段,例如将日期拆分为多个字段存储。
  • 使用 Keyword 类型存储不需要范围查询的数据,以提高查询速度。
  • 段合并可提高查询效率,但对经常变更的索引帮助不大。
  • 集群配置需合理设置节点角色,明确 Master、Data、Coordinating 和 Ingest 节点的职责。
  • 合理分配节点资源,Master 节点不需太多资源,Data 节点需大内存和多核 CPU。
  • 查询优化建议显式设置返回字段,使用 filter 查询,避免一次性返回大集合。
  • 高亮后置处理在程序中进行,避免使用脚本查询以提高性能。
  • ES 性能优化需综合考虑多个因素,具体问题具体分析。
➡️

继续阅读