实测DeepSeek V3.1,不止拓展上下文长度
💡
原文中文,约2700字,阅读约需7分钟。
📝
内容提要
DeepSeek V3.1在上下文长度和多格式支持上有所提升,编程、写作和翻译能力显著增强,且价格比Claude低68倍。用户反馈积极,但存在一些API问题。
🎯
关键要点
- DeepSeek V3.1在上下文长度和多格式支持上有所提升,最大上下文长度达到128K。
- V3.1在编程、写作和翻译能力上显著增强,表现优于V3。
- V3.1的价格比Claude低68倍,成为非推理模型的SOTA。
- 用户反馈积极,但存在一些API问题。
- V3.1在编程能力上提供了更全面的解决方案,考虑了更多可能性。
- 在情境写作中,V3.1的表达风格更具文艺性,情感更丰富。
- 数学理解能力方面,两个版本均能正确解答高考数学题,但呈现方式不同。
- 翻译能力上,V3.1对长难句的理解更好,但存在翻译遗漏的情况。
- 在冷门知识问答中,V3.1的回答存在偏题现象。
- V3.1在Reddit上得分71.6%,超越Claude Opus 4,成为非推理模型的领先者。
❓
延伸问答
DeepSeek V3.1的最大上下文长度是多少?
DeepSeek V3.1的最大上下文长度达到128K。
DeepSeek V3.1在编程能力上有什么显著改进?
V3.1在编程能力上提供了更全面的解决方案,考虑了更多可能性,并给出了详细的使用说明。
DeepSeek V3.1的翻译能力如何?
V3.1对长难句的理解更好,但存在翻译遗漏的情况。
DeepSeek V3.1的价格与Claude相比如何?
DeepSeek V3.1的价格比Claude低68倍。
用户对DeepSeek V3.1的反馈如何?
用户反馈积极,但存在一些API问题。
DeepSeek V3.1在冷门知识问答中的表现如何?
V3.1在冷门知识问答中存在偏题现象。
➡️