Grafana中计数器停止时的警报

Grafana中计数器停止时的警报

💡 原文英文,约300词,阅读约需1分钟。
📝

内容提要

heartbeat_count计数器用于监测应用程序的正常运行。每15秒发送一次心跳指标,若10分钟内缺失20次心跳,则触发警报。使用count_over_time()函数监测心跳计数,若低于20,表示应用在过去10分钟内未发送心跳。

🎯

关键要点

  • heartbeat_count计数器用于监测应用程序的正常运行。
  • 每15秒发送一次心跳指标。
  • 若10分钟内缺失20次心跳,则触发警报。
  • 使用count_over_time()函数监测心跳计数。
  • 若心跳计数低于20,表示应用在过去10分钟内未发送心跳。
  • 查询可以显示过去10分钟内每个应用的心跳计数。
  • 可以设置警报以监测心跳计数缺失的应用。
  • 新应用启动时会发送警报,因为过去10分钟内没有计数值。

延伸问答

heartbeat_count计数器的作用是什么?

heartbeat_count计数器用于监测应用程序的正常运行。

如何设置Grafana中的心跳计数警报?

可以使用count_over_time()函数监测心跳计数,并设置警报,当计数低于20时触发。

心跳指标的发送频率是多少?

每个应用程序每15秒发送一次心跳指标。

如果应用程序在10分钟内缺失多少次心跳会触发警报?

若10分钟内缺失20次心跳,则触发警报。

如何查询过去10分钟内每个应用的心跳计数?

可以使用查询语句sum by(application) (count_over_time(heartbeat_count{application!=""}[10m]))。

新应用启动时会发生什么?

新应用启动时会发送警报,因为过去10分钟内没有计数值。

➡️

继续阅读