质量视角下的系统稳定性保障--稳定性保障常态化自动化实践
原文中文,约2000字,阅读约需5分钟。发表于: 。随着系统数量增多,复杂度提高,线上应急问题时有发生;加之需投入大量人力进行服务治理和验证,为了减少日常应急问题及提前排除风险,发起对生产系统的持续综合性治理,实现常态化稳定性治理。在常态化治理过程中我们将识别问题等重复性有规律的工作实现自动化,技术人员更专注于解决问题。通过自动化的方式每日对线上核心UMP、Logbook、主机、数据库、ES、Redis风险进行巡检,降低人工review工作量...
京东物流针对生产系统的稳定性进行治理,通过自动化识别和处理风险来提升效率。组建研发、测试和架构师团队,专注于核心服务、服务器资源、性能和日志风险,持续监控和优化,减少人工工作量,确保系统稳定性。