Prometheus最佳实践 Summary和Histogram

💡 原文中文,约4200字,阅读约需10分钟。
📝

内容提要

本文介绍了Prometheus中的Histogram和Summary指标的最佳实践,包括它们的用途、适用场景和配置选择。Histogram适用于计数和监控容易,而Summary适用于计算分位数和聚合。在使用Histogram时,需要合理定义区间和确定分位数和滑动窗口。根据需要选择Histogram或Summary,并根据值的范围和分布选择合适的配置。

🎯

关键要点

  • Histogram和Summary都是复杂的指标,难以正确使用。
  • Histo和Summary用于采样观测,跟踪观测值的数量和总和。
  • Histogram适用于计数和监控,Summary适用于计算分位数和聚合。
  • 使用Histogram时,需要合理定义区间和确定分位数及滑动窗口。
  • Histogram可以用于计算Apdex分数,定义桶的界限以进行告警。
  • Summary在客户端计算分位数,Histogram在服务端计算分位数。
  • Histogram的配置需要合理定义区间,Summary的配置需要预定义分位数。
  • Histogram的监控性能较好,Summary的监控性能较差。
  • 分位数的计算是估计值,理解误差非常重要。
  • Histogram能够正确识别SLO,而Summary在多个客户端之间聚合时存在问题。
  • 选择Histogram时适合聚合,选择Summary时适合准确分位数计算。
➡️

继续阅读