2023 年 10 月 4 日 1.1.1.1 查询失败

💡 原文中文,约5300字,阅读约需13分钟。
📝

内容提要

Cloudflare在2023年10月4日出现DNS解析问题,已采取措施防止再次发生。改进包括添加警报功能、重新评估内部根区分发、改进测试流程、更好地管理缓存数据。

🎯

关键要点

  • 2023年10月4日,Cloudflare出现DNS解析问题,影响了部分用户。

  • 故障是由于内部软件错误造成的,而非攻击所致。

  • 根区中首次加入新资源记录类型ZONEMD,导致解析器系统在解析时遇到问题。

  • DNSSEC签名过期,导致Cloudflare解析器系统无法验证,增加了SERVFAIL响应。

  • 事件时间线显示故障从7:00 UTC开始,至11:02 UTC结束。

  • 故障影响主要集中在大型数据中心,SERVFAIL错误率峰值达到15%。

  • static_zone应用程序未能切换到新版本,导致使用过期根区。

  • 初步尝试禁用static_zone未成功,因标记未在转发查询中包含。

  • Cloudflare将采取措施改进可见性、恢复能力、测试和架构,以防止类似事件再次发生。

  • 事件提醒我们,现代系统需重视库的更新和测试,以应对输入变化。

➡️

继续阅读