一行代码如何造成 6000 万美元的损失

💡 原文中文,约1800字,阅读约需5分钟。
📝

内容提要

1990年1月15日,AT&T网络故障导致电话无法接通,航班延误,影响8.5万人。故障由软件错误引起,修复工程师花了9个小时恢复正常。AT&T在90年代还遇到了更多问题。故障规模巨大,人为错误和流程漏洞是根本原因。

🎯

关键要点

  • 1990年1月15日,AT&T网络故障导致电话无法接通,航班延误,影响8.5万人。
  • 故障由软件错误引起,网络故障持续了9个小时,导致呼叫连接故障率达到50%。
  • AT&T因此损失了6000多万美元,6万多名美国人的电话完全无法接通。
  • 故障源于纽约的一个交换机,因软件更新中的编码错误影响了114个交换机。
  • 错误发生在C语言程序中的嵌套条件语句,导致数据覆盖和系统重置。
  • 修复工程师花了9个小时恢复系统,主要通过将交换机回滚到之前的代码版本。
  • AT&T在90年代还遇到了更多系统崩溃的问题,故障的规模巨大。
  • 故障归根结底是人为错误和流程漏洞造成的,给公司带来了教训。
➡️

继续阅读