国内云厂商宕机事故频发,国外也这样吗?
原文中文,约3400字,阅读约需8分钟。发表于: 。这是头哥侃码的第305篇原创周末和朋友闲聊,有位不嫌事大的“吃瓜大佬”,又提起与国内云厂商宕机的事来。刚刚过去的4月某天,腾讯云愣是崩了 74 分钟(15:31 - 16:45),还波及全球 17 个区域与数十款服务。依赖云API提供产品能力的部分公有云服务,也因为云API的异常出现了无法使用的情况。去年11月末,阿里云宕机的事冲上热搜,什么阿里云盘,什么淘宝,什么闲鱼……几乎全线产品受到影响。这...
国内云厂商腾讯云、阿里云、滴滴和国外云厂商AWS都曾发生过宕机事件。故障反映了技术和管理问题,需要设计更健壮的系统和完善故障隔离和快速恢复机制。开发和运维是密不可分的,需要专业素质过硬的管理者领导团队。公司决策者应关注团队建设和专业素质提升。技术团队应更关注降本提效、降低系统复杂度成本、提高系统可观测性和松耦合程度。