2025年第一季度云与基础设施更新

2025年第一季度云与基础设施更新

💡 原文英文,约900词,阅读约需3分钟。
📝

内容提要

最近几个月,我进行了多个项目,包括Ubuntu服务器升级、C++联盟的服务器管理和自动化脚本编写。在升级过程中发现了多个问题,并通过Ansible编写新脚本以简化未来的升级。此外,还处理了Jenkins配置和Boost网站改进,确保数据库和代码覆盖率报告的准确性。

🎯

关键要点

  • 最近几个月进行了多个项目,包括Ubuntu服务器升级、C++联盟的服务器管理和自动化脚本编写。

  • Ubuntu LTS 24.04版本于2024年4月正式发布,但不建议立即升级现有服务器。

  • C++联盟托管约35个服务器实例,本季度将所有操作系统升级到24.04。

  • 对于关键工作负载,建议从头重建机器并迁移,而不是进行就地升级。

  • 使用Ansible编写新安装脚本,以简化未来的升级过程。

  • 升级多个服务器的好处在于可以发现和纠正小问题。

  • 在boost-ci中将lcov从v1.15升级到v2.3,导致出现了许多新的错误。

  • 通过自动化报告确认了常见错误,并允许开发者自定义错误忽略选项。

  • Jenkins进行了新配置和jenkinsfiles的调整,改进了gcovr/lcov覆盖率报告的bash脚本。

  • 正在进行boost网站的实验,安装水平Pod自动扩展器以自动扩展部署。

  • 处理IBM Cloud账户的账单问题,并将IBM服务器从圣保罗迁移到达拉斯。

  • 更新了GHA的新Windows 2025镜像,并调整了JSON基准格式和监控警报。

🔎

延伸解读

升级风险与建议

在进行Ubuntu 24.04的升级时,建议不要直接在现有服务器上进行就地升级,尤其是对于关键工作负载。因为就地升级可能会导致系统中断,重建机器并迁移数据是更安全的选择。特别是对于数据库服务器,升级后可能会生成空数据库,影响数据完整性。

自动化脚本的优势

通过使用Ansible编写的新安装脚本,可以显著简化未来的升级过程。这些脚本不仅提高了效率,还能确保在升级过程中不会遗漏重要组件。对于需要频繁升级的环境,自动化脚本的使用将大大降低人为错误的风险。

错误处理与报告

在升级lcov版本时,出现了许多新的错误,这些错误可能会影响代码覆盖率报告。通过将错误转换为警告,开发者可以在不影响报告可用性的情况下,逐步解决这些问题。这种处理方式在资源有限的情况下尤为重要,能够帮助开发者集中精力解决更紧急的问题。

延伸问答

Ubuntu 24.04版本的升级建议是什么?

不建议立即升级现有服务器,建议等到版本经过现场测试和验证后再进行升级。

C++联盟的服务器管理有哪些主要更新?

C++联盟托管的约35个服务器实例在本季度升级到Ubuntu 24.04,并建议对关键工作负载进行从头重建而非就地升级。

如何使用Ansible简化未来的服务器升级?

通过编写新的安装脚本,Ansible可以帮助简化未来的升级过程,例如为26.04或28.04版本的升级提供支持。

在boost-ci中升级lcov后出现了什么问题?

升级lcov后生成了许多新的错误,导致覆盖率报告失败,但通过测试启用了“忽略错误”选项。

Jenkins的配置有哪些改进?

对Jenkins进行了新配置和jenkinsfiles的调整,改进了gcovr/lcov覆盖率报告的bash脚本。

IBM Cloud账户的处理情况如何?

处理IBM Cloud账户的账单问题,并将IBM服务器从圣保罗迁移到达拉斯。

🏷️

标签

➡️

继续阅读