Cloudflare通过OpenBMC项目定制BMC固件,提升服务器启动监控和诊断能力。BMC是独立于CPU的远程管理微处理器。借助OpenBMC,Cloudflare实现灵活的固件管理,解决启动失败和内存模块丢失问题,并优化了服务器启动序列,提高自动化测试效率。团队持续改进,增强系统可靠性和管理能力。
Cloudflare宣布推出Workers AI,允许开发人员在Cloudflare的网络上运行无服务器GPU加速的AI推理。他们使用开源固件堆栈OpenBMC来管理基板管理控制器(BMCs)并调整固件以适应新的GPU。他们通过细调风扇PID控制器来管理温度波动和功耗。他们还通过SMBus协议与GPU建立通信。OpenBMC的应用和配置使设备的配置和操作变得简单。Cloudflare利用OpenBMC来获得对服务器配置的控制和灵活性。他们强调了开源固件对于修改服务器固件而不受传统设备更新周期限制的重要性。
This is what Cloudflare has been able to do so far with OpenBMC with respect to our GPU-equipped servers
该文介绍了在QEMU中运行OpenBMC的步骤,包括安装依赖、克隆仓库和编译系统镜像。通过SSH和IPMI可以访问虚拟机,并查看内部情况。在AST2600上构建系统镜像并添加WebUI。
完成下面两步后,将自动完成登录并继续当前操作。