InfoQ ·

DeepSeek-V3.2在推理任务上超越GPT-5

💡 原文英文，约600词，阅读约需2分钟。

📝

内容提要

DeepSeek发布了DeepSeek-V3.2开源AI模型，性能超过GPT-5，采用稀疏注意力机制和强化学习等新技术。尽管表现优异，但在知识广度和复杂任务解决上仍不及封闭模型，未来将致力于优化模型效率和知识积累。

🎯

🔎

DeepSeek-V3.2采用了稀疏注意力机制和强化学习等新技术，显著提高了推理效率和长上下文处理能力。然而，尽管在性能上超越了GPT-5，DeepSeek-V3.2在知识广度和复杂任务解决能力上仍存在不足，未来需要通过增加预训练计算来弥补这些差距。

在Hacker News的讨论中，用户指出开源模型如DeepSeek-V3.2在成本上具有明显优势。与封闭模型相比，使用开源模型可以降低AI应用的运行成本，尤其是在自有硬件上部署时，这为开发者提供了更多选择和灵活性。

DeepSeek团队计划在未来的版本中优化模型的智能密度和知识积累，以提升其在复杂任务上的表现。这表明，尽管DeepSeek-V3.2在当前表现优异，但仍需不断迭代以追赶封闭模型的领先地位。

❓

DeepSeek-V3.2在多个推理基准测试中表现优异，性能超过GPT-5，并且采用了稀疏注意力机制和强化学习等新技术。

DeepSeek-V3.2在知识广度和复杂任务解决上仍不及封闭模型，且在训练计算量上较少，导致知识积累不足。

DeepSeek-V3.2采用了稀疏注意力机制（DSA）和强化学习等新技术，以提高模型的效率和性能。

DeepSeek-V3.2的模型文件可以从Huggingface下载，但高计算版本仅通过DeepSeek的API提供。

DeepSeek-V3.2使用的新DSA注意力机制显著提高了长上下文场景的处理速度。

未来DeepSeek团队将致力于通过增加预训练计算来弥补知识差距，并优化模型推理链的智能密度。

🏷️