CPU 越多,延迟越高的问题排查
💡
原文中文,约3000字,阅读约需8分钟。
📝
内容提要
最近高规格CPU机器出现网络延迟问题,经过排查发现是内核网络栈中的中断处理延迟导致。使用trace-irqoff工具跟踪后,发现IPVS统计函数执行时间过长。通过关闭不必要的统计功能,问题得到解决。
🎯
关键要点
-
最近上线了一组高规格CPU机器,目的是进行POC测试。
-
高规格硬件虽然成本高,但总拥有成本(TCO)较低。
-
用户报告机器网络延迟高,经过排查发现问题出在内核网络栈。
-
中断处理延迟可能导致网络包处理延迟,使用trace-irqoff工具进行跟踪。
-
发现IPVS统计函数执行时间过长,导致中断处理被推迟。
-
通过关闭不必要的统计功能,问题得到解决。
➡️