极道 ·

英伟达Vera Rubin直接指挥硬盘：内存变HBM加HBF加SSD三层结构

💡 原文中文，约5200字，阅读约需13分钟。

📝

内容提要

英伟达计划通过Vera Rubin架构实现GPU直接管理存储，形成HBM、HBF和SSD三层内存结构。这将提升AI服务器性能，减轻CPU负担，闪存厂商将受益。HBF适合存储不常修改的模型参数，未来可能改变内存市场格局。预计2026年开始商业化。

🎯

🔎

英伟达的Vera Rubin架构引入HBM、HBF和SSD三层内存结构，意味着AI服务器的内存管理将更加高效。HBF作为中间层，专门存储不常修改的模型参数，能够提升存储密度，降低对CPU的依赖。这种结构的实现将可能改变内存市场的格局，尤其是对闪存厂商的影响显著。

HBF最适合用于存储推理用的模型参数，尤其是大型MoE模型和超长上下文推理。由于HBF的高存储密度和带宽优势，能够有效减少显卡对HBM的需求，从而提高显卡的利用率。然而，HBF的写入寿命较短，适合只读的场景，使用时需谨慎考虑数据访问模式。

尽管Vera Rubin架构的前景广阔，但实现显卡直接管理存储仍面临多重技术挑战，包括命令提交、内存保护和多租户隔离等问题。这些挑战可能导致HBF的商业化进程分阶段进行，初期可能仅在特定应用中实现，广泛应用还需时间和技术的进一步成熟。

❓

英伟达Vera Rubin架构的主要创新是实现GPU直接管理存储，形成HBM、HBF和SSD三层内存结构。

HBF适合存储不常修改的模型参数，是HBM的补充，主要用于提高存储密度。

新内存结构将提升AI服务器性能，减轻CPU负担，优化数据处理效率。

HBF的优势在于存储密度高，但写入寿命较短，适合只读的模型参数。

HBF预计将在2026年开始商业化，2027年实现更广泛的应用。

GIDS技术允许显卡直接发起存储访问，减少CPU的干预，改变数据控制路径。

🏷️