小红花·文摘

PaddleFormers驱动：最少国产算力完成DeepSeek-V3（671B）全参数微调实践

百度大脑 ·

机器之心数据服务现已上线，提供高效稳定的数据获取，简化数据爬取流程。

14B打败671B！微软rStar2-Agent在数学推理上超过DeepSeek-R1

机器之心 ·

机器之心数据服务现已上线，提供高效稳定的数据获取服务，简化数据爬取流程。

仅靠5000+样本，全新强化学习范式让30B轻松击败671B的DeepSeek V3

机器之心 ·

机器之心数据服务现已上线，提供高效稳定的数据获取，简化数据爬取流程。

普林斯顿团队领衔发布最强开源数学定理证明模型：32B性能大幅超越前代SOTA DeepSeek 671B

机器之心 ·

DeepSeek推出的Prover-V2模型专注于数学定理证明，刷新多项基准测试记录。该7B模型成功解决了671B模型未能解决的问题，展现出独特的推理模式。Prover-V2结合强化学习与子目标分解，提升了形式化与非形式化证明的能力，标志着数学领域的重要进展。

DeepSeek新数学模型刷爆记录！7B小模型自主发现671B模型不会的新技能

量子位 ·

DeepSeek-671b-Q4部署

elmagnifico ·

字节推出的Seed-Thinking-v1.5模型以200B参数超越DeepSeek-R1的671B，提升了推理表现。通过优化数据和强化学习算法，该模型在数学和代码等任务中表现优异。尽管在某些基准测试中仍落后于o3-mini-high，但其潜力引发关注。

字节新推理模型逆袭DeepSeek，200B参数战胜671B，豆包史诗级加强?

量子位 ·

7B扩散LLM，居然能跟671B的DeepSeek V3掰手腕，扩散vs自回归，谁才是未来？

机器之心 ·

上财开源首个金融领域R1类推理大模型，7B模型媲美DeepSeek-R1 671B满血版性能

机器之心 ·

DeepSeek-671B纯CPU部署经验分享(一)

腾讯安全玄武实验室 ·

阿里巴巴通义千问团队开源了QwQ-32B模型，参数320亿，性能接近6710亿参数的DeepSeek-R1。该模型通过强化学习提升推理能力，支持批判性思考，尤其在数学推理和代码编写方面表现优异，已在Apache 2.0许可证下开源。

阿里通义千问团队开源QwQ-32B模型规模更小但性能媲美DeepSeek-R1-671B

蓝点网 ·

鲶鱼效应搅翻AI江湖：DeepSeek 671B开源来袭，GPT-5和百度文心一言迎巨大挑战！

硕鼠的博客站 ·

免费！「DeepSeek-R1 671B满血版」不卡、不限次！问小白火速支援

机器之心 ·

通义灵码是阿里云与通义实验室合作开发的智能编码助手，支持200多种编程语言，兼容VS Code和JetBrains IDEs，具备智能补全、自然语言生成代码和智能问答等功能，帮助开发者高效编码。新模型选择功能允许用户根据需求切换模型，降低AI编程技术门槛。

如何在通义灵码里用上DeepSeek-V3 和 DeepSeek-R1 满血版671B模型？

蓝点网 ·

潞晨云推出“满血DeepSeek-671B-R1/V3解决方案”，提供免费通道、无代码使用和VIP通道，适合各类用户。支持联网搜索，提升回答准确性，企业级API价格低于官方，满足高性能需求。

免费！满血版DeepSeek丝滑畅玩，低门槛实现671B-R1/V3自由

量子位 ·

自DeepSeek R1发布以来，其强大性能引发广泛关注，导致官网服务器负担加重。为应对这一挑战，硅基流动与华为云联合推出基于昇腾云的DeepSeek R1 & V3推理服务，标志着国产GPU替代英伟达GPU的重要进展。此次合作有望改善国产GPU的适配性问题。

一文速览DeepSeek-R1的本地部署——可联网、可实现本地知识库问答：包括671B满血版和各个蒸馏版的部署(含单卡4090部署671B)

结构之法算法之道 ·

完整的671B MoE DeepSeek R1怎么塞进本地化部署？详尽教程大放送！

机器之心 ·

DeepSeek V3模型发布，参数量671B，训练成本仅557.6万美元，算力消耗为Llama 3的1/11。性能超越多款顶尖模型，生成速度提升3倍，API价格大幅降低，完全开源，支持FP8和BF16推理，受到广泛关注与测试。

国产之光DeepSeek把AI大佬全炸出来了！671B大模型训练只需此前算力1/10，细节全公开

量子位 ·

国产大模型DeepSeek-V3一夜火爆全球，671B的MoE，训练成本仅558万美元

机器之心 ·

PaddleFormers驱动：最少国产算力完成DeepSeek-V3（671B）全参数微调实践

14B打败671B！微软rStar2-Agent在数学推理上超过DeepSeek-R1

仅靠5000+样本，全新强化学习范式让30B轻松击败671B的DeepSeek V3

普林斯顿团队领衔发布最强开源数学定理证明模型：32B性能大幅超越前代SOTA DeepSeek 671B

DeepSeek新数学模型刷爆记录！7B小模型自主发现671B模型不会的新技能

DeepSeek-671b-Q4部署

字节新推理模型逆袭DeepSeek，200B参数战胜671B，豆包史诗级加强?

7B扩散LLM，居然能跟671B的DeepSeek V3掰手腕，扩散vs自回归，谁才是未来？

上财开源首个金融领域R1类推理大模型，7B模型媲美DeepSeek-R1 671B满血版性能

DeepSeek-671B纯CPU部署经验分享(一)

阿里通义千问团队开源QwQ-32B模型 规模更小但性能媲美DeepSeek-R1-671B

鲶鱼效应搅翻AI江湖：DeepSeek 671B开源来袭，GPT-5和百度文心一言迎巨大挑战！

免费！「DeepSeek-R1 671B满血版」不卡、不限次！问小白火速支援

如何在通义灵码里用上DeepSeek-V3 和 DeepSeek-R1 满血版671B模型？

免费！满血版DeepSeek丝滑畅玩，低门槛实现671B-R1/V3自由

一文速览DeepSeek-R1的本地部署——可联网、可实现本地知识库问答：包括671B满血版和各个蒸馏版的部署(含单卡4090部署671B)

完整的671B MoE DeepSeek R1怎么塞进本地化部署？详尽教程大放送！

国产之光DeepSeek把AI大佬全炸出来了！671B大模型训练只需此前算力1/10，细节全公开

国产大模型DeepSeek-V3一夜火爆全球，671B的MoE，训练成本仅558万美元

阿里通义千问团队开源QwQ-32B模型规模更小但性能媲美DeepSeek-R1-671B