DeepSeek R2难产真相！金融时报爆料：华为昇腾芯片训练失败，揭秘国产AI算力的“卡脖子”困境。

硕鼠的博客站 ·

DeepSeek R2难产真相！金融时报爆料：华为昇腾芯片训练失败，揭秘国产AI算力的“卡脖子”困境。

💡 原文中文，约11200字，阅读约需27分钟。

📝

内容提要

由于华为升腾芯片技术问题，Deepseek R2最终选择使用英伟达GPU进行训练。尽管国内模型逐渐进步，但在算力和训练能力上仍落后于国际大模型。国内芯片在推理方面可用，但大规模训练面临挑战，未来发展需耐心等待。

🎯

关键要点

Deepseek R2因华为升腾芯片技术问题，最终选择使用英伟达GPU进行训练。
国内模型在算力和训练能力上仍落后于国际大模型，尤其在大规模训练方面面临挑战。
升腾910C芯片在显存带宽和多芯片间速度上存在不足，影响训练效率。
Deepseek R2的发布被推迟，原因包括数据标注质量和速度问题。
国内算力芯片目前可用于推理，但无法进行大规模模型训练。
Deepseek的未来发展需要耐心等待，尽管面临技术瓶颈和市场竞争。

❓

延伸问答

Deepseek R2为何选择使用英伟达GPU进行训练？

Deepseek R2因华为升腾芯片技术问题，无法完成训练，最终被迫改用英伟达GPU。

华为升腾910C芯片存在哪些技术问题？

升腾910C芯片在显存带宽和多芯片间速度上存在不足，影响训练效率。

国内AI模型与国际大模型相比有哪些差距？

国内模型在算力和训练能力上仍落后于国际大模型，尤其在大规模训练方面面临挑战。

Deepseek R2的发布为何被推迟？

Deepseek R2的发布被推迟，原因包括数据标注质量和速度问题。

国内算力芯片在推理和训练方面的能力如何？

国内算力芯片目前可用于推理，但无法进行大规模模型训练。

Deepseek未来的发展前景如何？

Deepseek的未来发展需要耐心等待，尽管面临技术瓶颈和市场竞争。

🏷️

继续阅读

如何降低AI对话开发成本及部署AI对话开发应用？
AI对话项目在规模化运营后，成本控制成为关键。主要成本包括算力、带宽、服务器和数据迭代。优化路径包括利用成熟平台、模型分级调度、资源优化和建立成本监控体系...
科技爱好者周刊（第 399 期）：中国 AI 大厂访问记
今年5月，美国访问团考察了14家中国AI和机器人公司，发现中国在算力方面受限于美国的芯片出口管制，导致研发进展缓慢。尽管中国公司在效率上有所提升，但整体算...
有人靠CPU把AI算力密度卷到了新高度
英特尔推出新技术以应对Agentic AI的算力焦虑，提升AI算力密度，推动数据中心和AI的发展。
这家人工智能初创公司声称能够判断一个剧本是否会成为热门电影
AI初创公司Quilty声称通过剧本分析预测电影票房成功，但实际测试结果不佳，预测不准确。Quilty结合多种AI工具提供剧本分析和成功概率评分，旨在帮助...
您的AI费用失控了。Cloudflare现在可以解决这个问题。
Cloudflare推出AI Gateway，帮助企业控制AI支出。新功能包括预算限制和身份驱动的支出管理，允许按用户、团队或模型设置预算。通过集中管理，...
2026年数据与AI峰会：金融服务领导者的内部指南
2026年数据与AI峰会将于6月15日至18日在旧金山举行，聚焦金融服务行业的AI转型与现代化，主要议题包括保险承保、负责任的AI应用及资本市场智能化。与...