PolarDB 一写多读架构下读取到未来页的问题

💡 原文中文,约2300字,阅读约需6分钟。
📝

内容提要

PolarDB/Aurora的共享存储架构中,RO节点的延迟会影响RW节点的刷脏操作。目前的解决方法是让RO节点自动重启,但有用户希望RO节点不重启。解决方案可以从RW节点或RO节点入手,但都存在一些问题。限制RW节点会导致内存不足和性能下降,持久化redo log会增加延迟。RO节点处理不一致问题的方法简单但性能受影响。需要更细致的处理方法来解决逻辑和物理不一致问题。

🎯

关键要点

  • PolarDB/Aurora的共享存储架构中,RO节点的延迟会影响RW节点的刷脏操作。
  • 当前解决方案是让RO节点自动重启,但用户希望RO节点不重启。
  • 限制RW节点可能导致内存不足和性能下降,持久化redo log会增加延迟。
  • RO节点处理不一致问题的方法简单但性能受影响,需要更细致的处理方法。
  • PolarDB和Aurora都面临RO节点延迟导致的刷脏约束问题。
  • Aurora通过将延迟的page分散到多个Page Server上来减轻影响,而PolarDB则集中在一个节点上。
  • 解决方案可以从RW或RO节点入手,但都存在各自的问题。
  • 允许RW节点刷脏可能导致RO节点读取到future page。
  • 处理RO节点读取到future page的问题需要更复杂的逻辑。
  • 不一致问题主要包括逻辑不一致和物理不一致。
➡️

继续阅读