爱范儿 ·

实测低调上线的DeepSeek新模型：编程比Claude 4还能打，写作…还是算了吧 | 附彩蛋

💡 原文中文，约2900字，阅读约需7分钟。

📝

内容提要

DeepSeek新模型V3.1上线，参数达到6850亿，编程能力超越Claude 4，但写作表现较差。测试显示其在长文本处理和编程任务中表现优异，逻辑清晰，数学能力强。尽管创作能力不足，整体技术进步显著，备受关注。

🎯

🔎

DeepSeek V3.1在编程任务中的表现超越了Claude 4，得分71.6%显示其在开源模型中的领先地位。这意味着开发者可以更依赖于该模型进行复杂编程任务，尤其是在需要细致物理特性的项目中。

尽管DeepSeek V3.1在编程方面表现出色，但其写作能力却显得不足，生成内容往往信息密度过高，缺乏叙事张力。这提示用户在使用时需谨慎，尤其是在需要创意和流畅性的写作任务中。

DeepSeek V3.1被认为可能是融合推理与非推理模型的混合体，这一技术路线的有效性尚待验证。用户在选择使用时应关注其潜在的局限性和未来的技术发展方向。

❓

DeepSeek V3.1模型的参数达到6850亿。

DeepSeek V3.1的编程能力超越Claude 4，在编程基准测试中得分71.6%。

DeepSeek V3.1的写作表现较差，创作内容显得AI味重，信息密度过高。

DeepSeek V3.1在长文本处理方面表现优异，逻辑清晰。

DeepSeek V3.1的数学推导逻辑清晰，能够准确回答复杂问题。

DeepSeek V3.1移除了深度思考模式中的「R1」标识，并新增了原生「search token」支持，搜索功能得到优化。

🏷️