💡
原文中文,约1200字,阅读约需3分钟。
📝
内容提要
2026年5月7日,Coinbase因AWS数据中心冷却机故障导致多条交易通道不可用。CEO对此进行了回应,工程负责人随后发布了技术总结。Coinbase的撮合引擎使用Aeron集群,具备备份功能,但因用户需求未能进行可用区切换。Kafka集群的副本配置引发疑问,可能因成本考虑未能优化部署。
🎯
关键要点
-
2026年5月7日,AWS数据中心冷却机故障导致Coinbase多条交易通道不可用,持续数小时。
-
Coinbase的撮合引擎使用Java的Aeron集群,具备备份功能,但因用户需求未能进行可用区切换。
-
Coinbase的交易管理系统分为订单管理和清算两个模块,撮合系统有备用集群,但未能进行AZ切换。
-
Kafka集群的副本配置引发疑问,可能因成本考虑未能优化部署,导致在故障时无法有效切换。
❓
延伸问答
Coinbase在2026年5月7日发生了什么事故?
2026年5月7日,Coinbase因AWS数据中心冷却机故障导致多条交易通道不可用,持续数小时。
Coinbase的撮合引擎是如何工作的?
Coinbase的撮合引擎使用Java的Aeron集群,具备备份功能,能够在个别副本失效时不影响整体功能。
为什么Coinbase未能进行可用区切换?
Coinbase未能进行可用区切换是因为用户需求的限制,不能破坏用户的colocation。
Kafka集群的副本配置存在什么问题?
Kafka集群的副本配置引发疑问,可能因成本考虑未能优化部署,导致在故障时无法有效切换。
Coinbase的交易管理系统是如何分模块的?
Coinbase的交易管理系统分为订单管理和清算两个模块,撮合系统有备用集群。
Coinbase的事故对用户有什么影响?
事故导致Coinbase几乎所有撮合通道不可用,用户在此期间无法进行交易。
➡️