CPU 越多,延迟越高的问题排查

💡 原文中文,约3000字,阅读约需8分钟。
📝

内容提要

最近高规格CPU机器出现网络延迟问题,经过排查发现是内核网络栈中的中断处理延迟导致。使用trace-irqoff工具跟踪后,发现IPVS统计函数执行时间过长。通过关闭不必要的统计功能,问题得到解决。

🎯

关键要点

  • 最近上线了一组高规格CPU机器,目的是进行POC测试。

  • 高规格硬件虽然成本高,但总拥有成本(TCO)较低。

  • 用户报告机器网络延迟高,经过排查发现问题出在内核网络栈。

  • 中断处理延迟可能导致网络包处理延迟,使用trace-irqoff工具进行跟踪。

  • 发现IPVS统计函数执行时间过长,导致中断处理被推迟。

  • 通过关闭不必要的统计功能,问题得到解决。

➡️

继续阅读