旅游巨头Skyscanner重塑可观察性,工程成本降低90%

旅游巨头Skyscanner重塑可观察性,工程成本降低90%

💡 原文英文,约800词,阅读约需3分钟。
📝

内容提要

Skyscanner在疫情期间重塑了可观察性架构,采用OpenTelemetry标准化监控,提升数据收集效率,降低90%监控成本,并将服务水平目标(SLO)与用户体验关联,促进跨团队协作。

🎯

关键要点

  • Skyscanner在疫情期间重塑了可观察性架构,提升了监控系统的可靠性。
  • 公司在2020年开始转型,利用疫情期间识别和解决监控系统的弱点。
  • Skyscanner的旧架构复杂,使用了多种专用供应商和开源技术,导致工程师难以排查问题。
  • 新策略围绕采用OpenTelemetry作为服务监控的单一标准,并实施New Relic作为统一的数据存储和分析后端。
  • OpenTelemetry的API设计简化了迁移过程,使Skyscanner在几周内迁移了300多个微服务。
  • 团队在意识到数据收集和存储成本后,自愿寻找更高效的监控方法,部分团队的监控成本降低了90%。
  • Skyscanner推出了“可观察性大使”计划,促进最佳实践在团队中的传播。
  • 公司重新思考服务水平目标(SLO),将其与用户体验直接关联,而非仅关注技术指标。
  • 新的可观察性方法改变了Skyscanner管理跨域依赖关系的方式,促进了团队间的协作。
  • NOFire AI的文章强调了OpenTelemetry的变革性影响,建议SLO应关注用户体验而非任意技术指标。

延伸问答

Skyscanner在疫情期间做了哪些技术改进?

Skyscanner重塑了可观察性架构,采用OpenTelemetry标准化监控,提升数据收集效率,降低监控成本。

Skyscanner如何降低监控成本?

通过采用OpenTelemetry作为单一标准,实施New Relic作为统一的数据存储和分析后端,部分团队的监控成本降低了90%。

Skyscanner的新可观察性方法有什么文化影响?

新方法促使团队自愿寻找更高效的监控方式,许多团队开始依赖追踪而非冗长的日志记录,推动了文化转变。

Skyscanner如何将服务水平目标(SLO)与用户体验关联?

Skyscanner重新思考SLO,将其与用户体验直接关联,例如关注有效的航班搜索结果数量。

Skyscanner的可观察性大使计划是什么?

该计划旨在识别团队中的工程师,传播可观察性最佳实践,促进团队间的协作。

OpenTelemetry对Skyscanner的影响是什么?

OpenTelemetry简化了监控系统的迁移过程,提升了数据收集的效率,并促进了跨团队的协作。

➡️

继续阅读