💡
原文英文,约1500词,阅读约需6分钟。
📝
内容提要
Agoda在2023至2025年间流量激增50倍,面临工程挑战。团队通过优化ScyllaDB、改进缓存和数据模型、升级硬盘,成功实现300K EPS的容量提升,保持10ms延迟,顺利应对流量波动。
🎯
关键要点
- Agoda在2023至2025年间流量激增50倍,面临工程挑战。
- 团队需要优化ScyllaDB以保持10ms的延迟,面对突发流量和缓存命中率不稳定的问题。
- Agoda的特征存储支持离线模型训练和在线推理,是其业务的核心。
- 当前每秒服务约350万实体,使用DragonflyDB作为非持久化缓存。
- 在2023年中期,Agoda遇到容量问题,流量突增至120K EPS,导致缓存失效和请求重复。
- 通过增加客户端缓存和减少不必要请求,将流量降低至7K EPS,保持稳定。
- 团队通过测量冷缓存性能,发现不良数据中心的基线读取能力仅为5K EPS。
- 尝试不同的数据建模和压缩策略,最终通过调整SSTable摘要和使用NVMe硬盘实现300K EPS的容量提升。
- 升级硬盘后,Agoda成功实现50-60倍的性能提升,达到300K EPS。
- 团队总结出,正确设置ScyllaDB、快速存储和匹配数据模型是实现50倍扩展的关键。
➡️