机器之心 ·

创造历史！DeepSeek超越ChatGPT登顶中美AppStore

💡 原文中文，约3900字，阅读约需10分钟。

📝

内容提要

自发布以来，DeepSeek持续受到关注，iOS应用已超越ChatGPT，成为顶尖研究模型。Hugging Face等组织正在尝试复现DeepSeek-R1，但相关技术细节尚未完全公开。Meta对DeepSeek的成功感到焦虑，担心其Llama模型无法竞争。总体来看，DeepSeek引发了AI领域的重大变革。

🎯

关键要点

DeepSeek自发布以来持续受到关注，iOS应用超越ChatGPT，登顶AppStore。
DeepSeek-R1成为美国顶尖大学研究人员的首选模型，部分网友认为其是黑天鹅。
Hugging Face等组织尝试复现DeepSeek-R1，但相关技术细节尚未完全公开。
DeepSeek-R1的复现面临技术细节缺失、训练流程不明等挑战。
Hugging Face的Open R1项目致力于完全开放复现DeepSeek-R1，已完成部分工作。
香港科技大学的团队使用7B模型和8K样本成功复现R1，结果表现强劲。
TinyZero项目尝试复现DeepSeek-R1-Zero，发现基础模型质量和学习策略的重要性。
Meta对DeepSeek的成功感到焦虑，担心Llama模型无法竞争，正在组织团队学习DeepSeek的工作原理。
Meta考虑推出与DeepSeek相似的Llama版本，以提高模型运行效率和降低成本。
DeepSeek的成功可能引发新一年的大模型格局转变。

❓

延伸问答

DeepSeek是什么？

DeepSeek是一款新发布的AI应用，已在iOS平台上超越ChatGPT，成为顶尖研究模型。

DeepSeek-R1的复现面临哪些挑战？

复现DeepSeek-R1面临技术细节缺失、训练流程不明等挑战，尤其是缺少关键的实现细节和数据生成示例。

Hugging Face的Open R1项目有什么目标？

Open R1项目旨在完全开放复现DeepSeek-R1，补齐未公开的技术细节，已完成部分训练与评估代码。

Meta对DeepSeek的反应是什么？

Meta对DeepSeek的成功感到焦虑，担心其Llama模型无法竞争，并组织团队学习DeepSeek的工作原理。

香港科技大学的团队在复现R1时取得了什么成果？

香港科技大学的团队使用7B模型和8K样本成功复现R1，结果表现强劲，显示出长思维链和自我反思能力。

TinyZero项目的主要发现是什么？

TinyZero项目发现基础模型的质量和学习策略对复现DeepSeek-R1-Zero至关重要，且计算成本低于30美元。

🏷️

继续阅读

LWiAI播客第242期 - ChatGPT图像2.0，Qwen 3.6 Max，Kimi-K2.6
本期播客讨论了最新的AI新闻，包括OpenAI发布的ChatGPT图像2.0模型，生成文本和截图的能力显著提升；阿里巴巴推出Qwen 3.6 Max，转为...
DeepSeek识图模式是个新模型？！一手实测在此（没错我被灰度到了）
DeepSeek的识图模式在灰度测试中表现优异，支持快速识别和推理。非思考模式下速度快但准确性需提升；思考模式下推理能力强但耗时较长。该模式有效处理OCR...
Meta威胁称，如果被迫进行“技术上不可行”的更改，将撤回其在新墨西哥州的应用程序
Meta公司表示，如果新墨西哥州检察长的要求得以实施，他们可能会撤回Facebook、Instagram和WhatsApp。检察长要求的多项变更被Meta...
Meta正在为其AI工具投放快速致富广告
Meta收购的AI公司Manus正在推广其工具，声称可以帮助用户轻松赚取收入。该公司通过支付内容创作者在社交媒体上宣传其产品，鼓励用户利用AI为本地企业建...
Meta公司放弃开源Llama，转向专有的Muse Spark
Meta公司宣布其新AI模型Muse Spark将取代已被放弃的Llama。Muse Spark采用全新架构，无法与Llama迁移，Llama用户需寻找替...
Meta上个季度失去了2000万用户
Meta最近财报显示，Facebook、Instagram和WhatsApp等平台的日活跃用户减少了2000万。尽管用户流失，扎克伯格计划在人工智能上额外...