生产环境的质量监控实践和思考 - 老_张
原文中文,约1900字,阅读约需5分钟。发表于: 。昨天的文章《系统测试的实践与思考》中,分享了质量监控相关的思考。我是这样描述的: 质量监控是很多技术团队容易忽视的一点,即系统上线后才开始补上对应的各种主机资源监控、研发日志监控、服务监控和业务监控,但在上线后到补上监控的这段时间内,是线上故障的高发区。 更好的做法是,在系统测试阶段,就由测试同学推
本文分享了线上质量监控的实践和思考,包括主机监控、服务监控、业务监控、链路监控和日志监控。日志监控的实现包括日志收集、存储、分析、可视化和告警通知。建议在测试阶段或系统设计阶段考虑相关监控,并由测试同学参与监控系统的构建,以保障系统的线上质量。