量子位 ·

实测DeepSeek V3.1，不止拓展上下文长度

Q: 用户对DeepSeek V3.1的反馈如何？

用户反馈积极，但存在一些API问题。

Q: DeepSeek V3.1在冷门知识问答中的表现如何？

V3.1在冷门知识问答中存在偏题现象。

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

DeepSeek V3.1在上下文长度和多格式支持上有所提升，编程、写作和翻译能力显著增强，且价格比Claude低68倍。用户反馈积极，但存在一些API问题。

🎯

关键要点

DeepSeek V3.1在上下文长度和多格式支持上有所提升，最大上下文长度达到128K。
V3.1在编程、写作和翻译能力上显著增强，表现优于V3。
V3.1的价格比Claude低68倍，成为非推理模型的SOTA。
用户反馈积极，但存在一些API问题。
V3.1在编程能力上提供了更全面的解决方案，考虑了更多可能性。
在情境写作中，V3.1的表达风格更具文艺性，情感更丰富。
数学理解能力方面，两个版本均能正确解答高考数学题，但呈现方式不同。
翻译能力上，V3.1对长难句的理解更好，但存在翻译遗漏的情况。
在冷门知识问答中，V3.1的回答存在偏题现象。
V3.1在Reddit上得分71.6%，超越Claude Opus 4，成为非推理模型的领先者。

🔎

延伸解读

上下文长度的实用性

DeepSeek V3.1的最大上下文长度提升至128K，这意味着用户可以处理更复杂的文本和更长的对话。这对于需要深入分析或长篇写作的用户尤为重要，能够显著提高工作效率。

编程能力的增强

V3.1在编程能力上表现出色，能够提供更全面的解决方案和详细的使用说明。这对于开发者来说，意味着可以更快地获得所需的代码和指导，减少了调试和修改的时间。

翻译能力的局限性

尽管V3.1在翻译长难句方面表现更佳，但仍存在翻译遗漏的情况。这提醒用户在使用翻译功能时，需对结果进行仔细审查，尤其是在处理专业术语时。

用户反馈与API问题

虽然用户对DeepSeek V3.1的反馈总体积极，但API问题仍需关注。这可能影响到开发者在实际应用中的体验，建议在使用前了解相关的API限制和潜在问题。

❓

延伸问答

DeepSeek V3.1的最大上下文长度是多少？

DeepSeek V3.1的最大上下文长度达到128K。

DeepSeek V3.1在编程能力上有什么显著改进？

V3.1在编程能力上提供了更全面的解决方案，考虑了更多可能性，并给出了详细的使用说明。

DeepSeek V3.1的翻译能力如何？

V3.1对长难句的理解更好，但存在翻译遗漏的情况。

DeepSeek V3.1的价格与Claude相比如何？

DeepSeek V3.1的价格比Claude低68倍。

用户对DeepSeek V3.1的反馈如何？