💡
原文中文,约6600字,阅读约需16分钟。
📝
内容提要
本文介绍了根因分析的原则和业务结构,以及监控数据的分析。通过对Tomcat和Database的RT监控数据的比较,发现高并发情况下Tomcat的RT上升,Database的RT下降。进一步分析发现,这是因为Tomcat在Database响应慢时拦截流量,导致Tomcat的RT上升。同时提到了Druid连接池的报错问题和分片逻辑的影响。总结了问题的根本原因和压测能过的原因。
🎯
关键要点
- 根因分析的原则是追踪响应时间(RT)并识别各环节的消耗。
- 业务结构中,Tomcat作为上游业务,Database作为被依赖的下游业务。
- 监控数据显示高并发情况下Tomcat的RT上升,而Database的RT下降。
- Tomcat在Database响应慢时拦截流量,导致其RT上升。
- Druid连接池的报错问题影响了Tomcat与Database之间的连接。
- Druid连接池的初始化和监控逻辑是理解问题的关键。
- Druid连接池的错误状态需要综合比较以便更好地识别问题。
- 分片逻辑是为了处理大数据量,避免单一Database负载过重。
- 问题的根本原因在于多个Database中的瓶颈和数据分布不均。
- Tomcat通过拦截流量保护Database,但也导致其自身RT升高。
➡️