使用EventBridge和Lambda的自动故障排除与ITSM系统
原文英文,约2700词,阅读约需10分钟。发表于: 。Introduction : Folks, In IT Operations, it's a very generic task to monitor server metrices like utilization of cpu/memory and disk or filesystems, but in case any of the metrics gets triggered...
这篇文章介绍了一个开发系统的问题陈述和期望,该系统可以监控EC2实例的云监控警报,并在警报触发时登录到受影响的实例上执行一些基本故障排除命令。然后,创建一个JIRA问题来记录该事件,并在评论部分添加命令的输出。最后,发送一封自动邮件,提供所有警报和JIRA问题的详细信息。文章还提供了一些实施步骤和代码示例。