Andreas 'ads' Scherbaum:PostgreSQL中的11TB WAL
原文英文,约1200词,阅读约需5分钟。
📝
内容提要
网络运维团队在一个星期六发出警报:某个数据库服务器的磁盘使用率正在快速增长,经过调查发现,pgBackRest无法正常工作,原因是OpenRC init脚本中的一行代码出现错误,修复后,pgBackRest慢慢开始收集WAL文件,但由于WAL文件太多,花了一天的时间才收集完毕,还需要改进监控,以及定期备份。
🎯
关键要点
-
网络运维团队在周六发出警报,某数据库服务器的磁盘使用率快速增长。
-
调查发现pgBackRest无法正常工作,原因是OpenRC init脚本中的一行代码出现错误。
-
pg_wal目录的大小达到11TB,导致数据库无法回收WAL文件。
-
初步检查显示主服务器正常,但pgBackRest出现错误,无法归档WAL文件。
-
pgBackRest的日志权限设置不当,导致无法访问日志文件。
-
修复了OpenRC init脚本中的权限问题后,pgBackRest开始慢慢收集WAL文件。
-
收集WAL文件的过程耗时一天,未来需要改进监控和定期备份。
-
需要在系统中部署修复后的OpenRC init脚本,并验证当前的pgBackRest备份。
🏷️