系统运维 SysOM profiling 在云上环境的应用观测实践
💡
原文中文,约3400字,阅读约需8分钟。
📝
内容提要
SysOM是一个自动化运维平台,提供主机管理、配置部署、监控报警、异常诊断、安全审计等功能,其中profiling功能可以定期获取应用的执行栈信息,并利用bpf map对每个应用的栈信息做统计,可以帮助用户定位问题,提升运维效率。SysOM支持CentOS 7.6及以上、alinux2/3、anolis以及倚天Arm架构,正在开源中,敬请期待。
🎯
关键要点
- SysOM是一个自动化运维平台,提供主机管理、配置部署、监控报警、异常诊断、安全审计等功能。
- profiling功能可以定期获取应用的执行栈信息,帮助用户定位问题,提升运维效率。
- SysOM支持CentOS 7.6及以上、alinux2/3、anolis以及倚天Arm架构,正在开源中。
- 通过profiling可以动态观测程序的执行逻辑,帮助追踪系统资源异常。
- 使用eBPF获取程序栈信息,支持高频率、运行时安全和低资源占用的profiling。
- profiling可以观察程序的on cpu和off cpu状态,帮助发现应用的资源消耗问题。
- SysOM提供两种使用方式:监控模式和诊断模式,分别用于持续观测和获取结论性信息。
- profiling功能支持常规模式、trigger模式和filter模式,满足不同的监控需求。
- SysOM profiling功能已在多个案例中成功应用,解决了用户的系统性能问题。
- SysOM致力于打造一个集成多种运维功能的自动化平台,相关功能模块已完成功能验证,正在开源中。
➡️