DeepSeek发布了DeepSeek-V3.2和V3.2-Speciale两款新开源模型,性能接近GPT-5和Gemini-3.0-Pro。V3.2适合日常使用,而V3.2-Speciale在复杂任务中表现优异,具备强大的推理能力。团队指出开源模型与闭源模型之间的差距在扩大,并提出三项关键技术突破以提升开源模型的能力。
DeepSeek-V3.2系列模型发布,性能接近Gemini-3.0-Pro,适合日常问答和复杂任务。引入稀疏注意力机制DSA,显著降低计算复杂度。模型在Agent任务上表现优异,支持思考与工具调用。尽管存在知识广度和Token效率的局限,团队计划在未来版本中进行改进。
完成下面两步后,将自动完成登录并继续当前操作。