The New Stack ·

NVIDIA发布下一代Rubin和Feynman架构，推动AI性能极限

💡 原文英文，约2700词，阅读约需10分钟。

📝

内容提要

NVIDIA在技术行业中发挥关键作用，通过推出新硬件和AI软件推动市场发展。尽管产品更新频繁，客户仍难以跟上。新架构如Blackwell和Rubin将提升AI性能，但数据中心建设面临挑战。NVIDIA致力于简化开发，提供多种工具和开源模型，支持各行业应用。

🎯

🔎

NVIDIA在推出新硬件的同时，面临着客户难以跟上的挑战。频繁的产品更新使得企业客户在选择和部署时感到困惑，尤其是在数据中心建设和资源规划方面。企业需要提前规划，以应对不断变化的技术规格和市场需求。

购买GPU时，企业应考虑其实际使用寿命。与CPU相比，GPU的折旧周期通常较短，建议在2到3年内进行折旧。这意味着企业在投资GPU时需要评估其长期成本，可能更倾向于选择云服务提供商的最新GPU，以降低拥有成本。

NVIDIA的新架构如Rubin和Vera在性能上有显著提升，但也伴随着更高的功耗要求。企业在设计数据中心时，需关注这些新架构的能耗，以确保基础设施能够支持未来的技术需求，避免因能耗过高而导致的运营成本增加。

❓

Rubin GPU和Vera CPU将于2026年推出，具有更高的功耗要求和性能，Rubin NVL144将提供3.6 exaflops的FP4推理性能。

NVIDIA通过提供多种包装选项和未来路线图信息，帮助客户应对数据中心建设中的规格和功率密度不断上升的问题。

Blackwell架构通过将两个大型芯片直接连接，解决了GH200架构中CPU与GPU比例不当的问题，提升了性能。

NVIDIA的水冷光学交换机简化了大型集群的复杂性和成本，直接在交换芯片上终止光学连接，减少了对昂贵收发器的需求。

NVIDIA推出了新的开源模型和工具，如Dynamo软件，帮助优化推理效率，并支持各行业的AI应用开发。

GPU的技术更新速度快，实际使用寿命短于CPU，因此建议在2到3年内折旧，而不是常见的5到6年。

🏷️