土法炼钢兴趣小组的博客 ·

【大模型基础设施工程·特别篇】DeepSeek-V4 与国产芯片：从备份路线到主路径

💡 原文中文，约7600字，阅读约需18分钟。

📝

内容提要

DeepSeek-V4的发布标志着国产芯片在AI计算领域的重要进展，国产芯片已成为主流选择。未来，工程师需关注硬件与模型架构的结合，国产芯片的稳定性和系统能力将是关键。NVIDIA的市场地位面临挑战，采购和云服务将重新定价。国产芯片厂商需提升系统交付能力，以满足大模型的需求。整体来看，国产芯片的崛起将推动AI基础设施的变革。

🎯

关键要点

DeepSeek-V4的发布标志着国产芯片在AI计算领域的重要进展，国产芯片已成为主流选择。
国产芯片的稳定性和系统能力将是未来工程师关注的关键。
NVIDIA的市场地位面临挑战，采购和云服务将重新定价。
国产芯片厂商需提升系统交付能力，以满足大模型的需求。
国产AI芯片的崛起将推动AI基础设施的变革，改变算力供应链和系统软件栈。
未来模型团队需要更早考虑硬件约束，硬件与模型架构的结合将变得更加重要。
国产芯片的成功不仅在于能否运行旗舰模型，更在于能否成为模型公司规划新模型时的正常选项。
国产芯片厂商需从交付硬件转向交付系统，满足客户对稳定性和性能的需求。
推理端将更快进入规模化，推理引擎需要多后端化以适应不同的硬件环境。
企业采购将从单一选择转向算力组合，考虑整体成本和效益。

🔎

延伸解读

国产芯片的市场挑战

DeepSeek-V4的发布标志着国产芯片在AI计算领域的崛起，然而，NVIDIA仍然在软件生态和市场信任度上占据优势。国产芯片厂商需要在稳定性和系统能力上不断提升，以满足大模型的需求，才能在竞争中获得更大的市场份额。

硬件与模型架构的结合

随着国产芯片逐渐成为主流，模型团队需要更早地考虑硬件约束。这意味着在设计新模型时，必须关注如何在不同硬件上实现高效的计算和通信，确保模型能够在国产芯片上稳定运行。

企业采购的新策略

未来企业在采购算力时，将不再仅仅依赖于单一的高端NVIDIA卡，而是需要考虑多种算力组合。企业应关注整体成本和效益，评估国产芯片在特定应用场景下的表现，以制定更灵活的采购策略。

推理端的快速落地

推理端的应用将更快进入规模化，国产芯片在推理任务中的表现将直接影响其市场接受度。企业需要关注推理引擎的多后端化能力，以适应不同硬件环境，从而提升整体性能和用户体验。

❓

延伸问答

DeepSeek-V4的发布对国产芯片意味着什么？

DeepSeek-V4的发布标志着国产芯片在AI计算领域的重要进展，国产芯片已成为主流选择。

未来工程师在使用国产芯片时需要关注哪些关键因素？

未来工程师需关注国产芯片的稳定性和系统能力，以及硬件与模型架构的结合。

NVIDIA在市场中的地位会受到怎样的影响？

NVIDIA的市场地位面临挑战，采购和云服务将重新定价，议价权开始松动。

国产芯片厂商需要如何提升自身能力？

国产芯片厂商需提升系统交付能力，以满足大模型的需求，转向交付系统而非仅仅是硬件。

DeepSeek-V4如何改变大模型基础设施的分工？

DeepSeek-V4的成功意味着国产芯片可以承载真实旗舰模型的工程闭环，改变算力供应链和系统软件栈。

未来模型团队在设计时需要考虑哪些硬件约束？

模型团队需要更早考虑硬件约束，包括算子性能、通信模式和上下文长度等。

🏷️