💡
原文英文,约700词,阅读约需3分钟。
📝
内容提要
红帽公司承诺为Nvidia的新Vera Rubin平台提供“Day 0”支持,以缩短硬件与软件发布之间的差距。该平台通过新CPU、GPU和DPU降低AI推理成本,预计于2026年下半年发布。红帽将推出支持Nvidia GPU的RHEL和OpenShift平台,以促进AI推理。
🎯
关键要点
- 红帽公司承诺为Nvidia的新Vera Rubin平台提供“Day 0”支持,以缩短硬件与软件发布之间的差距。
- Vera Rubin平台旨在降低AI推理成本,预计于2026年下半年发布。
- 红帽将推出支持Nvidia GPU的RHEL和OpenShift平台,以促进AI推理。
- Vera Rubin平台由新CPU、GPU和DPU构成,能够将推理成本降低10倍,并减少4倍的GPU使用。
- 该平台的以太网光子交换系统承诺提供五倍的电力效率提升。
- 推理工作成本不断上升,AWS本周将其GPU价格提高了15%。
- Nvidia与Groq签署了价值200亿美元的许可协议,涉及推理和编译技术。
- 越来越多的推理需求促使AI系统的计算量激增,推理不再是单一的“一次性”答案,而是一个涉及多个模型的“思考过程”。
- 支持Rubin平台的公司包括AWS、Anthropic、Cisco、Google、Microsoft等。
➡️