量子位 ·

DeepSeek-V3.2系列开源，性能直接对标Gemini-3.0-Pro

💡 原文中文，约3900字，阅读约需10分钟。

📝

内容提要

DeepSeek-V3.2系列模型发布，性能接近Gemini-3.0-Pro，适合日常问答和复杂任务。引入稀疏注意力机制DSA，显著降低计算复杂度。模型在Agent任务上表现优异，支持思考与工具调用。尽管存在知识广度和Token效率的局限，团队计划在未来版本中进行改进。

🎯

关键要点

DeepSeek-V3.2系列模型发布，性能接近Gemini-3.0-Pro，适合日常问答和复杂任务。
引入稀疏注意力机制DSA，显著降低计算复杂度，推理能力比肩GPT-5。
DeepSeek-V3.2支持思考与工具调用，泛化能力强，适用于多种Agent任务。
DeepSeek-V3.2-Speciale版本专注于复杂任务，具备数学证明能力，但不支持工具调用。
DSA机制将计算复杂度降低到O(L·k)，显著加速长文本推理。
强化学习训练的计算预算超过预训练成本的10%，提升模型性能。
新模型在Agent任务上表现优异，支持推理和工具使用，优化了上下文管理。
评测结果显示DeepSeek-V3.2在多个基准测试中超越现有开源模型。
模型存在知识广度和Token效率的局限，未来版本将进行改进。

❓

延伸问答

DeepSeek-V3.2模型的主要特点是什么？

DeepSeek-V3.2模型性能接近Gemini-3.0-Pro，适合日常问答和复杂任务，支持思考与工具调用。

什么是稀疏注意力机制DSA，它的优势是什么？

稀疏注意力机制DSA将计算复杂度降低到O(L·k)，显著加速长文本推理，提升模型效率。

DeepSeek-V3.2-Speciale版本与标准版本有什么不同？

DeepSeek-V3.2-Speciale专注于复杂任务，具备数学证明能力，但不支持工具调用，消耗更多Tokens。

DeepSeek-V3.2在Agent任务上的表现如何？

DeepSeek-V3.2在Agent任务上表现优异，支持推理和工具使用，优化了上下文管理。

DeepSeek团队在强化学习方面做了哪些改进？

团队在强化学习中投入超过预训练成本的10%，开发了稳定的RL协议，提升模型性能。

DeepSeek-V3.2模型存在哪些局限性？

模型的知识广度和Token效率存在局限，未来版本计划进行改进。

🏷️

继续阅读

DeepSeek阮翀加盟元戎首秀，详解基座VLA，研发提效10倍
阮翀，元戎首席科学家，分享了如何利用40B基座模型提升自动驾驶研发效率。他强调数据表征和质量评估的重要性，指出基座模型加速了模型迭代，缩短了开发时间。同时...
SharpIDE：基于 .NET 与 Godot 引擎的跨平台开源 IDE - 张善友
SharpIDE是一款完全开源的跨平台集成开发环境，专为.NET生态系统设计，支持商业使用和修改。与Visual Studio和JetBrains Rid...
一款基于 .NET 开源免费、跨平台、支持多语言的交易管理系统
Oybab Trading System 是一款基于 .NET 的开源交易管理系统，支持多语言和跨平台运行，适用于个人交易、餐饮、零售和酒店等场景。系统具...
OpenClaw v2026.4.24更新：DeepSeek V4双模型、语音直达智能体和浏览器自动化升级
OpenClaw 2026.4.24版本更新了语音通话功能，支持完整智能体，提升用户体验。新增DeepSeek V4 Flash和Pro模型，优化快速响应...
这个开源skill一键反编译安卓应用：自动破解APK内部调用链和API
android-reverse-engineering-skill是一款自动化反编译工具，能够快速提取APK中的API和调用链。通过五个步骤，该工具实现反...
BBDuck支持Skill的免费开源图片压缩神器
BBDuck是一个开源的图片压缩工具，支持视觉无损压缩，能显著减少图片文件大小，经过一周开发，文件体积减少约60.93%。用户可以通过提供的链接体验和测试该工具。