💡
原文中文,约2200字,阅读约需6分钟。
📝
内容提要
DeepSeek推出全新V4模型,拥有1.6万亿参数和百万级上下文能力,超越Sonnet 4.5,适合编程和项目管理。腾讯和阿里积极投资,估值超过200亿美元。新API包括deepseek-v4-pro和deepseek-v4-flash,已开源并适配国产芯片。
🎯
关键要点
- DeepSeek推出全新V4模型,拥有1.6万亿参数和百万级上下文能力,超越Sonnet 4.5。
- V4-Pro采用MoE架构,具有384个专家,每次激活6个,Agent能力优于Sonnet 4.5。
- V4-Flash参数更小,推理能力接近Pro,适合成本敏感的场景。
- DeepSeek将百万上下文作为所有服务的标配,采用新注意力机制和DSA2稀疏注意力。
- DeepSeek获得腾讯和阿里的投资,估值超过200亿美元,显示出其技术水平的提升。
- 新API名称为deepseek-v4-pro和deepseek-v4-flash,旧接口将在三个月后停用。
- DeepSeek已开源V4模型,并针对国产芯片进行了优化,支持本地部署。
❓
延伸问答
DeepSeek V4模型的主要特点是什么?
DeepSeek V4模型拥有1.6万亿参数和百万级上下文能力,超越Sonnet 4.5,适合编程和项目管理。
DeepSeek V4-Pro和V4-Flash有什么区别?
V4-Pro采用MoE架构,具有更强的Agent能力,而V4-Flash参数更小,推理能力接近Pro,适合成本敏感的场景。
DeepSeek V4模型如何实现百万上下文能力?
DeepSeek通过新的注意力机制和DSA2稀疏注意力技术,实现了百万上下文能力,显著降低了计算量和显存需求。
DeepSeek的融资情况如何?
DeepSeek获得腾讯和阿里的投资,估值超过200亿美元,显示出其技术水平的提升。
DeepSeek V4模型的API名称是什么?
新模型的API名称为deepseek-v4-pro和deepseek-v4-flash,旧接口将在三个月后停用。
DeepSeek V4模型是否支持国产芯片?
是的,DeepSeek V4模型专门针对寒武纪进行了优化,支持国产芯片。
➡️