Andreas 'ads' Scherbaum:PostgreSQL中的11TB WAL

💡 原文英文,约1200词,阅读约需5分钟。
📝

内容提要

网络运维团队在一个星期六发出警报:某个数据库服务器的磁盘使用率正在快速增长,经过调查发现,pgBackRest无法正常工作,原因是OpenRC init脚本中的一行代码出现错误,修复后,pgBackRest慢慢开始收集WAL文件,但由于WAL文件太多,花了一天的时间才收集完毕,还需要改进监控,以及定期备份。

🎯

关键要点

  • 网络运维团队在周六发出警报,某数据库服务器的磁盘使用率快速增长。

  • 调查发现pgBackRest无法正常工作,原因是OpenRC init脚本中的一行代码出现错误。

  • pg_wal目录的大小达到11TB,导致数据库无法回收WAL文件。

  • 初步检查显示主服务器正常,但pgBackRest出现错误,无法归档WAL文件。

  • pgBackRest的日志权限设置不当,导致无法访问日志文件。

  • 修复了OpenRC init脚本中的权限问题后,pgBackRest开始慢慢收集WAL文件。

  • 收集WAL文件的过程耗时一天,未来需要改进监控和定期备份。

  • 需要在系统中部署修复后的OpenRC init脚本,并验证当前的pgBackRest备份。

🏷️

标签

➡️

继续阅读