PolarDB 一写多读架构下读取到未来页的问题

💡 原文中文,约2300字,阅读约需6分钟。
📝

内容提要

PolarDB/Aurora的共享存储架构中,RO节点的延迟会影响RW节点的刷脏操作。目前的解决方法是让RO节点自动重启,但有用户希望RO节点不重启。解决方案可以从RW节点或RO节点入手,但都存在一些问题。限制RW节点会导致内存不足和性能下降,持久化redo log会增加延迟。RO节点处理不一致问题的方法简单但性能受影响。需要更细致的处理方法来解决逻辑和物理不一致问题。

🎯

关键要点

  • PolarDB/Aurora的共享存储架构中,RO节点的延迟会影响RW节点的刷脏操作。

  • 当前解决方案是让RO节点自动重启,但用户希望RO节点不重启。

  • 限制RW节点可能导致内存不足和性能下降,持久化redo log会增加延迟。

  • RO节点处理不一致问题的方法简单但性能受影响,需要更细致的处理方法。

  • PolarDB和Aurora都面临RO节点延迟导致的刷脏约束问题。

  • Aurora通过将延迟的page分散到多个Page Server上来减轻影响,而PolarDB则集中在一个节点上。

  • 解决方案可以从RW或RO节点入手,但都存在各自的问题。

  • 允许RW节点刷脏可能导致RO节点读取到future page。

  • 处理RO节点读取到future page的问题需要更复杂的逻辑。

  • 不一致问题主要包括逻辑不一致和物理不一致。

延伸问答

PolarDB的RO节点延迟会对RW节点造成什么影响?

RO节点的延迟会影响RW节点的刷脏操作,导致RW节点无法进行刷脏。

目前PolarDB如何处理RO节点的延迟问题?

目前的处理方法是让RO节点自动重启,以避免RW节点出现问题。

如果不限制RW节点刷脏,会出现什么问题?

如果不限制RW节点刷脏,RO节点可能会读取到future page,导致数据不一致。

PolarDB和Aurora在处理RO节点延迟方面有什么不同?

Aurora通过将延迟的page分散到多个Page Server上来减轻影响,而PolarDB则集中在一个节点上。

处理RO节点读取到future page的问题需要什么样的逻辑?

需要更复杂的逻辑来处理RO节点读取到future page的问题,包括逻辑不一致和物理不一致的判断。

PolarDB和Aurora在刷脏约束方面面临哪些风险?

两者都面临RO节点延迟过大导致的节点崩溃风险,PolarDB可能导致RW节点无法刷脏,Aurora则可能导致Page server无法推进。

🏷️

标签

➡️

继续阅读