量子位 ·

最新英伟达经济学：每美元性能是AMD的15倍，“买越多省越多”是真的

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

最新报告显示，英伟达在AI算力上每美元性能是AMD的15倍，尽管价格较高，但整体成本更低。MoE架构使英伟达在复杂推理模型中表现优越，显著提升性能和成本效益。

🎯

🔎

尽管英伟达的产品价格较高，但其在AI算力上的每美元性能是AMD的15倍，这意味着在特定条件下，使用英伟达的系统可以显著降低生成同样数量token的成本。这一现象表明，企业在选择AI算力平台时，需关注整体成本效益，而不仅仅是初始投资。

MoE（专家混合）架构通过将模型参数拆分为多个专家子网络，显著降低了计算成本。这种架构在复杂推理模型中表现尤为突出，尤其是在高交互性条件下，英伟达的优势愈加明显。企业在开发AI应用时，应考虑采用MoE架构以提升性能和效率。

虽然英伟达在前沿推理模型中表现出色，但AMD在密集模型和容量驱动场景下仍具备竞争力。随着AMD的Helios解决方案的开发，未来可能会缩小与英伟达的差距。企业在选择平台时，应关注各自的应用场景，以做出更合适的决策。

❓

英伟达在AI算力上每美元性能是AMD的15倍，尽管价格较高，但整体成本更低。

MoE架构通过将模型参数拆分成多个专家子网络，使得每个token只激活一小部分，从而降低计算成本并提升性能。

GB200 NVL72的价格是MI355X的1.86倍，但在性能上具有显著优势，尤其在复杂模型上表现更佳。

在复杂模型DeepSeek-R1上，GB200 NVL72的性能是MI355X的28倍，显示出英伟达在高强度推理生成中的明显优势。

Dynamo推理框架通过分离式预填充-解码调度和动态KV缓存路由，有效突破了8卡系统的通信瓶颈。

尽管英伟达占据优势，AMD在密集模型和容量驱动场景下仍有竞争力，且正在开发新的解决方案Helios以缩小差距。

🏷️