肖恩·M·托马斯:探讨一次意外的Postgres停机
原文英文,约2200词,阅读约需8分钟。发表于: 。Nobody likes it when their database goes down for any reason, especially if it was unintentional. Sometimes companies are open about their experiences and provide post-mortems for the world to...
RevenueCat从AWS Aurora Postgres 10迁移到14,期间遇到了一次为期五小时的停机。尽管他们进行了详细的计划和努力,但仍然出现了一些问题。他们成功地执行了大量的计划,创建了一个并行集群,并预热了Postgres缓存。然而,由于新集群缺少ANALYZE和序列同步的问题,他们遇到了困难。他们可以通过确保正确的ANALYZE和复制所有序列来避免这些问题。此外,RevenueCat应该提前进行迁移,以避免在更新方面落后。总体而言,他们从这次经历中学到了很多,并应考虑在未来的升级中咨询Postgres专家。