一行代码如何造成 6000 万美元的损失
💡
原文中文,约1800字,阅读约需5分钟。
📝
内容提要
1990年1月15日,AT&T网络故障导致电话无法接通,航班延误,影响8.5万人。故障由软件错误引起,修复工程师花了9个小时恢复正常。AT&T在90年代还遇到了更多问题。故障规模巨大,人为错误和流程漏洞是根本原因。
🎯
关键要点
- 1990年1月15日,AT&T网络故障导致电话无法接通,航班延误,影响8.5万人。
- 故障由软件错误引起,网络故障持续了9个小时,导致呼叫连接故障率达到50%。
- AT&T因此损失了6000多万美元,6万多名美国人的电话完全无法接通。
- 故障源于纽约的一个交换机,因软件更新中的编码错误影响了114个交换机。
- 错误发生在C语言程序中的嵌套条件语句,导致数据覆盖和系统重置。
- 修复工程师花了9个小时恢复系统,主要通过将交换机回滚到之前的代码版本。
- AT&T在90年代还遇到了更多系统崩溃的问题,故障的规模巨大。
- 故障归根结底是人为错误和流程漏洞造成的,给公司带来了教训。
➡️