💡
原文英文,约1600词,阅读约需6分钟。
📝
内容提要
Teletracking 实施了 Grafana 自适应指标来管理大量指标并将成本降低了 50%。他们创建了一个指标支出仪表板,并依靠 Grafana 的基数管理仪表板等工具来应对峰值。他们计划探索其他功能,如自适应日志。
🎯
关键要点
- Teletracking 实施了 Grafana 自适应指标以管理大量指标,降低了 50% 的成本。
- 迁移到云原生基础设施时,Teletracking 面临着大量未被充分利用的指标,导致成本飙升。
- 团队管理的时间序列数量从 100 万增加到 200 万,显示出指标的快速增长。
- 主要成本来源是用于测量业务事件的自定义指标和支持业务服务的依赖关系。
- 在蓝绿部署期间,时间序列数量可能会迅速翻倍,增加管理复杂性。
- 高基数指标类似于日志的冗长性,缺乏控制机制导致不必要的指标增加成本。
- 团队需要手动检测和解决与指标相关的问题,常常对成本激增做出反应。
- Grafana 自适应指标有效减少了指标的冗长性,帮助降低了成本。
- 使用 Grafana 自适应指标后,Teletracking 在几周内实现了 50% 的成本削减。
- Grafana 自适应指标帮助优化 Prometheus 基数,确保只为使用的指标付费。
- 尽管 Grafana 帮助减少了一些负担,指标泛滥的问题仍然存在,团队需要持续监控和管理。
- Lion 创建了一个指标支出仪表板,以跟踪每个团队的时间序列数量和成本。
- 未来,Teletracking 计划探索自适应日志等其他功能,以进一步节省时间和成本。
➡️