dotNET跨平台 ·

DeepSeek悄悄干了一件大事，但所有人的目光都在OpenAI身上

💡 原文中文，约2200字，阅读约需6分钟。

📝

内容提要

DeepSeek推出全新V4模型，拥有1.6万亿参数和百万级上下文能力，超越Sonnet 4.5，适合编程和项目管理。腾讯和阿里积极投资，估值超过200亿美元。新API包括deepseek-v4-pro和deepseek-v4-flash，已开源并适配国产芯片。

🎯

🔎

DeepSeek V4模型的1.6万亿参数和百万级上下文能力，使其在编程和项目管理方面表现出色。尤其是V4-Pro采用的MoE架构，能够在保持高效的同时，提供更强的Agent能力，超越了Sonnet 4.5。这一技术进步意味着开发者可以更高效地利用AI进行复杂任务，提升工作效率。

DeepSeek V4的开源策略和对国产芯片的适配，标志着其在技术普及和本土化方面的努力。开源使得更多开发者能够使用和改进这一模型，而针对寒武纪等国产芯片的优化，则为国内企业提供了更具成本效益的解决方案。这一举措不仅提升了技术的可获取性，也促进了国产技术的发展。

DeepSeek V4推出后，旧的API接口将在三个月后停用，用户需及时更新到新接口deepseek-v4-pro和deepseek-v4-flash。未及时更换接口可能导致服务中断，因此开发者应提前做好准备，确保业务的连续性。

❓

DeepSeek V4模型拥有1.6万亿参数和百万级上下文能力，超越Sonnet 4.5，适合编程和项目管理。

V4-Pro采用MoE架构，具有更强的Agent能力，而V4-Flash参数更小，推理能力接近Pro，适合成本敏感的场景。

DeepSeek通过新的注意力机制和DSA2稀疏注意力技术，实现了百万上下文能力，显著降低了计算量和显存需求。

DeepSeek获得腾讯和阿里的投资，估值超过200亿美元，显示出其技术水平的提升。

新模型的API名称为deepseek-v4-pro和deepseek-v4-flash，旧接口将在三个月后停用。

是的，DeepSeek V4模型专门针对寒武纪进行了优化，支持国产芯片。

🏷️