Rally 和 Elasticsearch 基准测试:如何解读仅导入轨迹

Rally 和 Elasticsearch 基准测试:如何解读仅导入轨迹

💡 原文英文,约1100词,阅读约需4分钟。
📝

内容提要

这篇文章分析了竞赛报告,重点关注与数据导入相关的指标,包括存储大小、传输日志大小和堆使用指标。文章介绍了数据导入管道指标和吞吐量指标的解释和计算方法,并强调了百分位延迟和错误率的重要性。

🎯

关键要点

  • 竞赛报告开始时有免责声明,强调在使用Rally时需注意数据删除和集群重启。
  • 存储大小约为44GB,是评估存储优化的重要指标。
  • 传输日志大小和堆使用指标在此案例中不重要,可以忽略。
  • 段计数基于所有主分片,不适用于本次分析,可以忽略。
  • 数据导入管道指标在本案例中不适用,但在其他情况下可提供文档处理时间和失败文档数量的信息。
  • 吞吐量指标是评估索引性能的关键,包括最小、平均、中位和最大吞吐量。
  • 最大吞吐量通常在基准测试的最初几秒内达到,实际生产环境中难以维持。
  • 平均和中位吞吐量应接近,当前平均为17,500文档每秒,中位为16,600文档每秒。
  • 百分位延迟指标显示90%的索引请求在两秒内完成,99%的请求在4.7秒内完成。
  • 错误率指标帮助识别因映射冲突、消息损坏等导致的失败消息数量。
➡️

继续阅读