机器之心 ·

清华翟季冬：DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

💡 原文中文，约8700字，阅读约需21分钟。

📝

内容提要

DeepSeek团队在两个月内利用2048张H800 GPU训练出与顶尖模型相媲美的成果，挑战了传统算力规模观念。翟季冬教授强调，系统软件创新是提升算力效能的关键，需在有限资源下优化算法和软件。目前国内算力资源闲置，亟需探索从应用到芯片的完整链路，以推动AI产业发展。

🎯

关键要点

DeepSeek团队用2048张H800 GPU在两个月内训练出媲美顶尖模型的成果，挑战传统算力规模观念。
翟季冬教授强调系统软件创新是提升算力效能的关键，需要在有限资源下优化算法和软件。
国内算力资源闲置，亟需探索从应用到芯片的完整链路，以推动AI产业发展。
AI发展将更注重资源的高效利用，而非单纯追求算力规模。
DeepSeek通过系统软件的深度创新实现了百倍性价比提升。
性能优化是一个无止境的过程，需要在多个技术层面发力，建立完整的基础软件体系。
国内智算中心的算力资源闲置，暴露出基础软件体系的短板。
打通从应用到系统软件，再到自主芯片的完整链路是中国发展的重要机遇。
算力主导AI竞争力，如何最大化每一份计算资源的价值至关重要。
DeepSeek的成功展示了在有限算力情况下，通过算法和软件的协同创新可以挖掘硬件的极致性能。
中美硬件差异使得中国在系统软件方面需要不同的思考方向，需提升芯片易用性。
针对不同架构特点，中国需要在软件栈方面进行创新，打通应用侧到系统软件的路径。
Transformer专用芯片尚未推出，主要因市场空间和技术演变的不确定性。
系统软件需密切关注上下层变化，合理设计以匹配硬件效率。
万卡集群训练面临并行策略选择、通信问题和容错机制等技术挑战。
提升算力利用率需关注不同阶段的负载特点，优化策略应从整体pipeline角度考虑。
未来1-3年，国产算力需达到与NVIDIA相同的易用性，以促进AI在各行业的发展。

❓

延伸问答

DeepSeek团队是如何在短时间内训练出高效模型的？

DeepSeek团队利用2048张H800 GPU，在两个月内通过系统软件的深度创新和算法优化，训练出媲美顶尖模型的成果。

翟季冬教授认为提升算力效能的关键是什么？

翟季冬教授强调，系统软件创新是提升算力效能的关键，需要在有限资源下优化算法和软件。

国内算力资源闲置的原因是什么？

国内算力资源闲置主要是由于供需错配，暴露出基础软件体系的短板。

DeepSeek如何实现百倍性价比提升？

DeepSeek通过系统软件的深度创新和算法优化，实现了百倍性价比的提升。

未来1-3年国产算力的发展趋势是什么？

未来1-3年，国产算力需达到与NVIDIA相同的易用性，以促进AI在各行业的发展。

在算力主导AI竞争力的时代，如何最大化计算资源的价值？

最大化计算资源的价值需要通过系统软件创新和算法优化，提升算力的利用效率。

🏷️

继续阅读

便宜好用真香！美国企业把DeepSeek买上了趋势榜第一
Ramp发布的2026年热门软件供应商榜单显示，中国AI公司DeepSeek首次重返增长，企业采用率为0.1%。其成本显著低于Anthropic和Open...
Roku LT OS开源解析：从遥控器系统到电动赛车控制平台
Roku开源了Roku LT OS，旨在为开发者提供轻量化架构和高度确定性的执行能力，适用于嵌入式设备和电动赛车。该系统强调资源控制和时间可预测性，已在电...
谷歌800亿融资，巴菲特久违接盘，背后有什么鬼故事？
谷歌融资847.5亿美元并停止股票回购，以应对未来挑战并囤积现金。巴菲特的伯克希尔哈撒韦投资100亿美元，显示市场对AI的信心。科技巨头们纷纷转向AI基础...
10个Hermes黑客技巧变24小时工作系统
本文介绍了将Hermes智能体转变为24小时自动化系统的10种方法，包括任务控制中心、事件触发器、定时任务、目标指令、子智能体、工作区、看板、技能包、网络...
英博数科亮相CCIG 2026，首次公开EBFlex私有化算力管理平台
2026年中国图象图形大会将在广州举行，重点关注图象图形与人工智能等前沿技术。英博数科展示了EBFlex私有化算力管理平台，旨在提升高校科研算力的供给与管...
在Vibe编码时代使OWASP前十名更具影响力
2025年OWASP前十名更新将重点从“过时组件”转向软件供应链安全，新增内存安全和“vibe编码”意识项，反映了开发者和网络应用安全领域对关键安全风险的共识。