小众软件 ·

最强开源模型 DeepSeek V4 发布，1M上下文，运行成本大降

💡 原文中文，约1300字，阅读约需3分钟。

📝

内容提要

DeepSeek V4 发布，具备 1M 上下文和显著提升的代码能力，推理性能接近顶尖模型。新注意力机制降低计算需求，支持更多请求。V4 Pro 价格上涨，但在知识和推理任务上表现优异。现已上线官网和 API，无法自行部署。

🎯

🔎

DeepSeek V4 引入的全新注意力机制，结合 DSA 稀疏注意力，显著降低了计算和显存需求。这意味着开发者在使用该模型时，可以在相同硬件条件下处理更多请求，提升了模型的实用性和灵活性。

尽管 DeepSeek V4 在推理性能上接近顶尖模型，但在知识类能力上仍落后于一些闭源模型，如 GPT-5 和 Claude。这提示用户在选择模型时，需要根据具体应用场景权衡性能与知识能力的差异。

V4 Pro 的价格上涨可能会影响用户的选择，尤其是在预算有限的情况下。尽管其在知识和推理任务上表现优异，但用户需评估其性价比，尤其是在与 V3.2 的对比中。

❓

DeepSeek V4 具备 1M 上下文，代码能力明显提升，推理性能接近顶尖模型。

新注意力机制结合 DSA 稀疏注意力，显著降低计算和显存需求，支持更长的上下文。

V4 Pro 的价格上涨，但在知识和推理任务上表现优异。

算力需求比 V3.2 降低 3～10 倍，支持更多请求。

DeepSeek V4 现已上线官网和 API，无法自行部署。

在知识和推理任务上，DeepSeek V4 Pro 表现优异，尤其在事实问答和代码生成方面有显著提升。

🏷️