小红花·文摘 - 小红花技术领袖俱乐部

2021年10月，Facebook因BGP配置错误宕机超过6小时，损失超1亿美元。2023年阿里云和2024年CrowdStrike也发生类似故障。文章探讨容灾架构的核心概念，包括恢复点目标（RPO）、恢复时间目标（RTO）和恢复成本目标（RCO），分析不同容灾等级的特点与适用场景，如冷备、温备、热备、同城双活和异地多活。强调选择容灾方案需平衡业务价值与技术成本，定期演练是确保方案有效性的关键。

【系统架构设计】容灾架构：多活与灾备设计

土法炼钢兴趣小组的博客 ·

构建弹性身份基础设施：AWS IAM 和 STS 的多区域容灾最佳实践

构建弹性身份基础设施：AWS IAM 和 STS 的多区域容灾最佳实践

亚马逊AWS官方博客 ·

利用CloudEndure进行On-Prem到AWS云上灾备的最佳实践

利用CloudEndure进行On-Prem到AWS云上灾备的最佳实践

亚马逊AWS官方博客 ·

GBase 8s集群技术包括共享存储集群（SSC）、本地高可用集群（HAC）和远程高可用集群（RHAC）。SSC通过共享磁盘支持多达128个节点，适合大规模业务。HAC利用日志同步进行本地灾备，支持同步、半同步和异步模式。RHAC用于远程灾备，支持多达256个备用节点，适合分布式系统。GBase 8s为金融业务提供高安全性和可用性的数据库解决方案。

GBase 8s数据库三种集群模式介绍

DEV Community ·

AWS EMR HBase 例行灾备方案：快照备份与还原演练

AWS EMR HBase 例行灾备方案：快照备份与还原演练

亚马逊AWS官方博客 ·

本文围绕云数据库RDS对数据库的灾备方案进行介绍，除了RDS实例以外，完整的灾备方案还应该包含主机、LB等部署您应用程序的所有其他资源。灾备预案需要在实际生产环境中反复测试和验证，完整的灾备方案可以让您及时发现潜在问题，更加从容地应对生产环境中的各种意外和风险及时发现潜在的问题。

如何守护数据安全？这里有一份RDS灾备方案为你支招

京东科技开发者 ·