量子位 ·

DeepSeekV3.2技术报告还是老外看得细

💡 原文中文，约3000字，阅读约需8分钟。

📝

内容提要

DeepSeek-V3.2和V3.2-Speciale是新发布的开源AI模型，推理任务表现优异，性能接近顶尖闭源模型，且成本显著低于竞争对手，适合在国产算力上部署以进一步降低推理成本。

🎯

🔎

DeepSeek-V3.2的发布标志着开源AI模型在性能上逐渐追赶顶尖闭源模型，尤其是在推理任务中表现出色。这一趋势可能会促使更多开发者和企业转向开源解决方案，从而降低整体研发成本。

DeepSeek-V3.2在推理成本上显著低于竞争对手，尤其适合在国产算力上部署。这意味着企业在使用AI模型时，可以在保持性能的同时，大幅降低运营成本，提升经济效益。

尽管DeepSeek-V3.2在性能上与顶尖闭源模型相当，但在某些任务中仍需更多token来完成。这表明，技术的提升与经济成本之间存在权衡，企业在选择模型时需综合考虑性能与成本。

❓

这两款模型在推理任务中表现优异，DeepSeek-V3.2达到了GPT-5的水平，而V3.2-Speciale超越了GPT-5，并在多个国际竞赛中获奖。

DeepSeek-V3.2的推理成本比GPT-5便宜近24倍，比Gemini 3 Pro便宜近29倍，且在百万token输出成本上差距可达43倍。

模型通过DSA稀疏注意力和可扩展的强化学习提升了推理能力，允许生成极长的思维链以进行深度自我修正。

DeepSeek-V3.2在性能上接近顶尖闭源模型，并且成本显著低于竞争对手，适合在国产算力上部署。

DeepSeek-V3.2的发布挑战了闭源模型的主导地位，证明了开源模型也能在性能和成本上具备竞争力。

DeepSeek-V3.2通过长上下文的强化学习持续扩展，允许模型在不增加预训练规模的情况下提升性能。

🏷️