进阶篇丨链路追踪(Tracing)很简单:链路成本指南

💡 原文中文,约3800字,阅读约需10分钟。
📝

内容提要

本文介绍了冷热存储分离的实现方式及其优势,热数据存储周期短,成本低,可以满足实时全量后聚合分析需求;而冷数据经过精准采样后数据总量大幅下降,可以满足大多数场景的诊断诉求。冷热存储分离实现了成本与体验的平衡最优解,已被国内外领先的APM产品采用。

🎯

关键要点

  • 链路成本包括机器资源和人力运维成本,本文聚焦于机器资源成本。
  • 链路追踪机器成本分为客户端和服务端,客户端开销隐性,需控制在合理范围内。
  • 服务端成本显性,包含网关、消息缓冲、流计算、存储与查询端,存储成本是重要考量。
  • 网络传输费用在跨公网场景下显著,需采用头部采样降低上报量。
  • 边缘集群解决方案可降低链路数据上报与存储成本,支持多源异构数据标准化。
  • 链路数据的价值不均匀,关键链路的存储时长应更长,普通链路应减少记录。
  • 链路倾斜采样优先记录查询概率高的链路,降低存储成本。
  • 链路计算左移将数据处理提前至客户端,减少数据上报量。
  • 冷热存储分离实现成本与体验的平衡,热数据满足实时分析,冷数据经过采样后存储量大幅下降。
  • 冷热存储分离已被领先APM产品采用,提供更高性价比的数据价值探索。
➡️

继续阅读