实测DeepSeek V3.1,不止拓展上下文长度

💡 原文中文,约2700字,阅读约需7分钟。
📝

内容提要

DeepSeek V3.1在上下文长度和多格式支持上有所提升,编程、写作和翻译能力显著增强,且价格比Claude低68倍。用户反馈积极,但存在一些API问题。

🎯

关键要点

  • DeepSeek V3.1在上下文长度和多格式支持上有所提升,最大上下文长度达到128K。
  • V3.1在编程、写作和翻译能力上显著增强,表现优于V3。
  • V3.1的价格比Claude低68倍,成为非推理模型的SOTA。
  • 用户反馈积极,但存在一些API问题。
  • V3.1在编程能力上提供了更全面的解决方案,考虑了更多可能性。
  • 在情境写作中,V3.1的表达风格更具文艺性,情感更丰富。
  • 数学理解能力方面,两个版本均能正确解答高考数学题,但呈现方式不同。
  • 翻译能力上,V3.1对长难句的理解更好,但存在翻译遗漏的情况。
  • 在冷门知识问答中,V3.1的回答存在偏题现象。
  • V3.1在Reddit上得分71.6%,超越Claude Opus 4,成为非推理模型的领先者。

延伸问答

DeepSeek V3.1的最大上下文长度是多少?

DeepSeek V3.1的最大上下文长度达到128K。

DeepSeek V3.1在编程能力上有什么显著改进?

V3.1在编程能力上提供了更全面的解决方案,考虑了更多可能性,并给出了详细的使用说明。

DeepSeek V3.1的翻译能力如何?

V3.1对长难句的理解更好,但存在翻译遗漏的情况。

DeepSeek V3.1的价格与Claude相比如何?

DeepSeek V3.1的价格比Claude低68倍。

用户对DeepSeek V3.1的反馈如何?

用户反馈积极,但存在一些API问题。

DeepSeek V3.1在冷门知识问答中的表现如何?

V3.1在冷门知识问答中存在偏题现象。

➡️

继续阅读