TechWeb 全站精华 ·

中国AI模型震惊硅谷 DeepSeek为何一夜火出圈？

💡 原文中文，约2600字，阅读约需6分钟。

📝

内容提要

中国AI公司深度求索（DeepSeek）推出的大模型DeepSeek-R1以低成本和小算力实现与美国顶尖AI模型相媲美的效果，迅速引起关注。该模型在美国App Store下载榜超越ChatGPT，吸引了西方媒体的目光。DeepSeek成立于2023年，由本土团队组成，专注于高效AI技术的开发，其模型训练成本仅为OpenAI的十分之一，展现了通过算法创新突破算力限制的潜力。

🎯

关键要点

中国AI公司深度求索（DeepSeek）推出的大模型DeepSeek-R1以低成本和小算力实现与美国顶尖AI模型相媲美的效果。
DeepSeek-R1在美国App Store下载榜超越ChatGPT，排名第一，引起西方媒体关注。
DeepSeek成立于2023年，专注于高效AI技术的开发，其模型训练成本仅为OpenAI的十分之一。
DeepSeek由幻方量化创立，创始人梁文锋是量化交易领域的专家，团队成员多为本土人才。
DeepSeek-R1在数学、代码、自然语言推理等任务上的表现与OpenAI的O1模型相当，采用MIT许可协议，支持免费商用。
DeepSeek的成功打破了算力为王的行业规则，展示了通过算法创新突破算力限制的潜力。
DeepSeek的火爆导致其服务出现短时宕机，创始人表示中国AI需要原创和模仿的转变。
DeepSeek近期发布并开源了多模态AI模型Janus-Pro-7B，表现优于OpenAI的DALL-E3和Stable Diffusion。

🔎

延伸解读

DeepSeek的成本优势

DeepSeek-R1的训练成本仅为OpenAI的十分之一，这一显著的成本优势可能会改变AI行业的竞争格局。低成本的模型不仅降低了进入门槛，也为更多企业和开发者提供了使用AI技术的机会，推动了AI的普及和应用。

市场反应与风险

DeepSeek的成功引发了美股科技股的剧烈波动，尤其是英伟达等公司的股价大幅下跌。这表明市场对AI行业未来的预期正在发生变化，投资者需关注技术创新带来的潜在风险与机遇，尤其是在竞争加剧的背景下。

原创与模仿的转变

DeepSeek创始人梁文锋强调，中国AI需要从模仿转向原创。这一观点反映了行业内对技术自主创新的迫切需求，未来的竞争将不仅仅依赖于算力，更需要在算法和应用场景上实现突破。

❓

延伸问答

DeepSeek-R1模型的训练成本是多少？

DeepSeek-R1的预训练费用为557.6万美元，仅为OpenAI GPT-4o模型训练成本的十分之一。

DeepSeek的创始人是谁？

DeepSeek的创始人是梁文锋，他是量化交易领域的专家。

DeepSeek-R1在什么任务上表现出色？

DeepSeek-R1在数学、代码和自然语言推理等任务上的表现与OpenAI的O1模型相当。

DeepSeek的成功对美国科技股有什么影响？

DeepSeek的成功导致美股科技股大幅下跌，纳指开盘重挫逾3.5%。

DeepSeek的团队成员主要来自哪里？

DeepSeek团队成员多来自清华、北大、北航等顶尖高校，且全部为本土人才。

DeepSeek-R1的开源协议是什么？

DeepSeek-R1采用MIT许可协议，支持免费商用和任意修改。

🏷️