扑朔迷离的根因分析

扑朔迷离的根因分析

💡 原文中文,约6600字,阅读约需16分钟。
📝

内容提要

本文介绍了根因分析的原则和业务结构,以及监控数据的分析。通过对Tomcat和Database的RT监控数据的比较,发现高并发情况下Tomcat的RT上升,Database的RT下降。进一步分析发现,这是因为Tomcat在Database响应慢时拦截流量,导致Tomcat的RT上升。同时提到了Druid连接池的报错问题和分片逻辑的影响。总结了问题的根本原因和压测能过的原因。

🎯

关键要点

  • 根因分析的原则是追踪响应时间(RT)并识别各环节的消耗。
  • 业务结构中,Tomcat作为上游业务,Database作为被依赖的下游业务。
  • 监控数据显示高并发情况下Tomcat的RT上升,而Database的RT下降。
  • Tomcat在Database响应慢时拦截流量,导致其RT上升。
  • Druid连接池的报错问题影响了Tomcat与Database之间的连接。
  • Druid连接池的初始化和监控逻辑是理解问题的关键。
  • Druid连接池的错误状态需要综合比较以便更好地识别问题。
  • 分片逻辑是为了处理大数据量,避免单一Database负载过重。
  • 问题的根本原因在于多个Database中的瓶颈和数据分布不均。
  • Tomcat通过拦截流量保护Database,但也导致其自身RT升高。
➡️

继续阅读