量子位 ·

国产之光DeepSeek把AI大佬全炸出来了！671B大模型训练只需此前算力1/10，细节全公开

💡 原文中文，约4000字，阅读约需10分钟。

📝

内容提要

DeepSeek V3模型发布，参数量671B，训练成本仅557.6万美元，算力消耗为Llama 3的1/11。性能超越多款顶尖模型，生成速度提升3倍，API价格大幅降低，完全开源，支持FP8和BF16推理，受到广泛关注与测试。

🎯

关键要点

DeepSeek V3模型发布，参数量671B，训练成本仅557.6万美元。
训练消耗算力为Llama 3的1/11，生成速度提升3倍。
DeepSeek V3完全开源，支持FP8和BF16推理。
API价格大幅降低，输入tokens价格为0.5元（缓存命中）/ 2元（缓存未命中）。
模型在多项测评中超越Llama 3.1和其他顶尖模型。
训练过程仅用了不到280万个GPU小时，效率极高。
DeepSeek V3的预训练阶段在每万亿token上仅需18万GPU小时。
引入创新的负载均衡策略和多Token预测目标以提高性能。
DeepSeek V3的MoE由256个路由专家和1个共享专家组成。
团队的专业知识和经验为DeepSeek的成功奠定基础。

❓

延伸问答

DeepSeek V3模型的参数量是多少？

DeepSeek V3模型的参数量为671B。

DeepSeek V3的训练成本是多少？

DeepSeek V3的训练成本为557.6万美元。

DeepSeek V3的算力消耗与Llama 3相比如何？

DeepSeek V3的算力消耗为Llama 3的1/11。

DeepSeek V3的生成速度提升了多少？

DeepSeek V3的生成速度提升了3倍，每秒生成60个tokens。

DeepSeek V3的API价格如何？

DeepSeek V3的API价格为每百万输入tokens 0.5元（缓存命中）/ 2元（缓存未命中）。

DeepSeek V3支持哪些推理格式？

DeepSeek V3支持FP8和BF16推理。

🏷️

继续阅读

【Rust日报】2026-05-01 Rust 原生数据表格组件 uiGrid 发布
Rust开发者推出了功能丰富的uiGrid数据表格组件，支持分组、过滤、排序等操作，具备树形视图和单元格编辑功能。该项目已开源，采用MIT许可证，支持自定...
国产大模型编码能力实测(GLM 5.1、Kimi K2.6、Mimo v2.5 Pro 和 DeepSeek V4 Pro)
本文对四款国产大模型（GLM 5.1、Kimi K2.6、Mimo v2.5 Pro 和 DeepSeek V4 Pro）的编码能力进行了实测。结果显示，...
开源社区“内战”爆发：Bun 创始人预言“未来将禁止人类贡献”，硅谷大佬纷纷站队！
开源社区因Bun创始人Jarred Sumner的言论而分裂，预言未来将禁止人类贡献代码。Zig社区坚守传统开源精神，反对AI生成的“垃圾代码”。硅谷大佬...
生物研究正在变成软件工程：AI开始接管生物实验大脑！
生物研究正逐渐依赖AI进行数据分析，推动科学判断的自动化。AI能够高效筛选和分析生物数据，提升研究效率。未来，数据分析能力将成为生物研究的核心，快速将数据...
生产就绪AI的九项检查清单
文章讨论了将AI原型转变为可靠生产系统的过程，强调构建“AI平台切片”的重要性。平台团队需解决基础设施、安全性和可观察性等问题，以确保AI服务的可靠性和可...
魔法战胜魔法：AI提示词还得AI写
文章探讨了AI提示词的写作，认为人类编写提示词效率低下，AI更擅长此事。人类与AI的交流是跨物种沟通，AI能更好理解自身语言习惯。提示词工程师的角色正在被...