baotiao ·

用 Claude Code 在 PostgreSQL 实现 Double Write Buffer 遇到的一些问题

💡 原文中文，约1900字，阅读约需5分钟。

📝

内容提要

最近尝试使用Claude Code编写PostgreSQL的双写缓冲区（DWB）代码，但Claude未能理解缓冲区I/O与直接I/O的设计差异，导致实现存在问题。PG的脏页写入机制与InnoDB不同，需要考虑多进程并发刷脏。最终认为设计应由人负责，Claude负责实现。

🎯

🔎

在使用Claude Code进行PostgreSQL的双写缓冲区实现时，设计问题显得尤为重要。Claude虽然能快速生成代码，但缺乏对系统设计的理解，导致了实现上的错误。因此，建议在项目中明确分工，由人负责设计，Claude负责代码实现，以确保系统的稳定性和性能。

PostgreSQL的脏页写入机制与InnoDB存在本质差异，前者使用Buffer I/O而后者使用Direct I/O。这种差异影响了数据的安全性和写入效率。在设计双写缓冲区时，必须考虑到这些差异，以避免在系统崩溃时导致数据丢失。

在引入双写缓冲区后，单进程的刷脏机制无法满足性能需求。由于fsync操作变得更加频繁，建议采用多进程并发刷脏的方式，以提高系统的写入效率和响应速度。这一调整对于确保数据一致性至关重要。

❓

Claude未能理解缓冲区I/O与直接I/O的设计差异，导致实现存在问题。

PostgreSQL使用缓冲区I/O，脏页写入后需要强制fsync到磁盘，而InnoDB使用直接I/O，写入后链路清晰。

因为引入DWB后，每次写完脏页需要fsync，单个BG Writer进程无法跟上这种重量级I/O操作。

Claude照搬了InnoDB的Batch优化策略，但在PostgreSQL中并不必要。

建议由人负责设计，Claude负责实现，以确保设计约束和架构决策的清晰。

因为在Buffer I/O下，脏页必须确保写入磁盘后才能回收DWB的slot，以避免数据丢失。

🏷️