一系列故障:亚马逊网络服务大规模中断的分析

一系列故障:亚马逊网络服务大规模中断的分析

💡 原文英文,约600词,阅读约需3分钟。
📝

内容提要

亚马逊网络服务(AWS)在美国东部地区因DNS配置错误发生故障,导致多个云服务中断。虽然大部分服务已恢复,但EC2实例启动仍有问题,影响了Snapchat、Reddit等大型在线业务。

🎯

关键要点

  • 亚马逊网络服务(AWS)在美国东部地区因DNS配置错误发生故障,导致多个云服务中断。
  • 故障影响了多个服务,包括AWS Lambda、Amazon API Gateway、Amazon Appflow和Amazon Aurora DSQL服务。
  • 美国东部地区(US-EAST-1)是AWS最大的区域之一,许多大型企业在此有业务。
  • 大部分服务已恢复,但EC2实例启动仍存在问题,影响了Snapchat、Reddit等大型在线业务。
  • 故障最初在东部时间凌晨3点左右出现,主要是DynamoDB API端点的DNS解析错误。
  • AWS团队在早上6点时表示,全球依赖US-EAST-1的服务也已恢复。
  • EC2实例启动问题持续存在,管理员建议不要在该区域启动实例。
  • 监控负载均衡器的系统导致Lambda服务出现问题,影响了多个服务的连接性。
  • 尽管只影响一个区域,但对许多依赖AWS的在线业务造成了深远影响。

延伸问答

亚马逊网络服务的故障是由于什么原因引起的?

故障是由于DNS配置错误引起的。

哪些服务受到亚马逊网络服务故障的影响?

受到影响的服务包括AWS Lambda、Amazon API Gateway、Amazon Appflow和Amazon Aurora DSQL服务等。

故障发生在哪个地区,影响了哪些大型企业?

故障发生在美国东部地区(US-EAST-1),影响了Snapchat、Reddit、Venmo等大型企业。

亚马逊网络服务的恢复情况如何?

大部分服务已恢复,但EC2实例启动仍存在问题,管理员建议不要在该区域启动实例。

故障最初是何时发生的?

故障最初在东部时间凌晨3点左右发生。

EC2实例启动问题的原因是什么?

EC2实例启动问题与内部网络和负载均衡器的监控系统有关。

➡️

继续阅读