机器之心 ·

自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言

💡 原文中文，约5900字，阅读约需15分钟。

📝

内容提要

DeepSeek R1 模型引发了关于其训练成本和技术创新的广泛讨论。前 Stability AI 研究主管 Tanishq Abraham 反驳了相关谣言，强调 DeepSeek 在持续进步和创新方面的努力。尽管面临国家安全的质疑，DeepSeek 在 AI 领域，尤其是开源方面的成就依然显著。总体来看，中美 AI 竞争加剧，但美国仍保持优势。

🎯

关键要点

DeepSeek R1 模型引发了广泛讨论，涉及训练成本和技术创新。
前 Stability AI 研究主管 Tanishq Abraham 反驳了关于 DeepSeek 的谣言，强调其持续创新。
DeepSeek 在 AI 领域，尤其是开源方面的成就显著，尽管面临国家安全质疑。
DeepSeek 是一家早已被全球 AI 研究人员知晓的公司，并非突然冒出。
关于 DeepSeek 训练成本的质疑缺乏依据，600 万美元的估算是合理的。
DeepSeek 的训练效率高于许多其他 LLM，且其成功与英伟达的市场地位无关。
DeepSeek 在模型设计和训练方式上有多项创新，开源并记录了这些进步。
关于 DeepSeek 从 ChatGPT 吸取知识的说法缺乏证据，且不影响其成就。
中美在 AI 领域的竞争加剧，但美国仍保持领先地位。
DeepSeek 的 R1 模型值得认可，其技术创新和效率表现令人印象深刻。

🔎

延伸解读

DeepSeek的技术创新

DeepSeek在模型设计和训练方法上展现了多项创新，如多潜在注意力机制和高效的强化学习算法GRPO。这些创新不仅提升了模型性能，还在开源领域提供了新的思路，值得其他研究者借鉴。

中美AI竞争的现状

尽管DeepSeek的崛起引发了对中国AI实力的关注，但美国在AI领域仍保持领先。未来的竞争将更加激烈，尤其是在技术创新和计算资源的获取上，双方都在不断加大投入。

关于训练成本的误解

围绕DeepSeek训练成本的质疑缺乏依据。600万美元的估算是基于合理的市场分析，且DeepSeek的训练效率高于许多其他模型。理解训练成本的构成对于评估AI模型的实际表现至关重要。

❓

延伸问答

DeepSeek R1 模型的训练成本是多少？

DeepSeek R1 模型的训练成本估算为600万美元，这一数字基于多项分析得出。

DeepSeek在AI领域有哪些显著的创新？

DeepSeek在模型设计和训练方式上有多项创新，包括多重潜在注意力机制、GRPO算法和DualPipe训练方法。

DeepSeek是否真的从ChatGPT吸取了知识？

关于DeepSeek从ChatGPT吸取知识的说法缺乏证据，且DeepSeek的成就并不依赖于此。

DeepSeek的开源模型R1与其他模型相比有什么优势？

DeepSeek R1模型在训练预算较低的情况下，性能与OpenAI的o1相当，并且用户体验良好。

DeepSeek面临哪些国家安全质疑？

由于DeepSeek是一家中国公司，其新模型受到美国及其科技公司的国家安全质疑。

中美在AI领域的竞争现状如何？

中美在AI领域的竞争加剧，但美国仍保持领先地位，尽管中国在开源领域表现出色。

🏷️

标签

AI DeepSeek 中美竞争开源技术创新

➡️

继续阅读

腾讯混元 Hy3 开源发布：大模型竞争正转向工程化落地
腾讯混元Hy3的开源发布标志着国产大模型竞争向工程化落地转变。Hy3提升了后训练数据的质量和多样性，强调在推理和复杂任务中的应用。开源使团队能够在可控环境...
OpenAI与Databricks在DAIS 2026：让企业AI变为现实
Databricks与OpenAI的合作正在缩小前沿AI与企业生产之间的差距，提供数据治理和先进智能，帮助企业将原型转化为可靠的生产代理。在DAIS 20...
片段：7月6日
Thoughtworks在欧洲举办了第二届软件开发未来研讨会，与会者讨论了AI在软件开发中的作用，强调良好设计的重要性以应对对AI的依赖风险。同时，企业面...
华为云码道商用新版本发布，聚焦企业级开发让AI真正融入存量项目
华为云码道（CodeArts）新版发布，增强了增量开发和安全能力，支持多端接入，提升代码生成精准度，扩充专家技能市场，提供多种开发场景的专业能力。新增安全...
模型不是企业的护城河，那什么才是？
在AI时代，企业面临的挑战是如何将AI转化为智能引擎。尽管大模型不断增强，企业的竞争力仍依赖于专业化能力的积累。衔远科技提出的EnterpriseClaw...
GitHub 热门项目周刊 · 第 18 期 · 2026 年第 28 周
本期GitHub热门项目周刊精选了10个开源项目，涵盖AI和开发工具等领域。主要项目包括：T3MP3ST（基于TypeScript的红队平台）、ios-l...