DeepSeek悄悄干了一件大事,但所有人的目光都在OpenAI身上

DeepSeek悄悄干了一件大事,但所有人的目光都在OpenAI身上

💡 原文中文,约2200字,阅读约需6分钟。
📝

内容提要

DeepSeek推出全新V4模型,拥有1.6万亿参数和百万级上下文能力,超越Sonnet 4.5,适合编程和项目管理。腾讯和阿里积极投资,估值超过200亿美元。新API包括deepseek-v4-pro和deepseek-v4-flash,已开源并适配国产芯片。

🎯

关键要点

  • DeepSeek推出全新V4模型,拥有1.6万亿参数和百万级上下文能力,超越Sonnet 4.5。
  • V4-Pro采用MoE架构,具有384个专家,每次激活6个,Agent能力优于Sonnet 4.5。
  • V4-Flash参数更小,推理能力接近Pro,适合成本敏感的场景。
  • DeepSeek将百万上下文作为所有服务的标配,采用新注意力机制和DSA2稀疏注意力。
  • DeepSeek获得腾讯和阿里的投资,估值超过200亿美元,显示出其技术水平的提升。
  • 新API名称为deepseek-v4-pro和deepseek-v4-flash,旧接口将在三个月后停用。
  • DeepSeek已开源V4模型,并针对国产芯片进行了优化,支持本地部署。

延伸问答

DeepSeek V4模型的主要特点是什么?

DeepSeek V4模型拥有1.6万亿参数和百万级上下文能力,超越Sonnet 4.5,适合编程和项目管理。

DeepSeek V4-Pro和V4-Flash有什么区别?

V4-Pro采用MoE架构,具有更强的Agent能力,而V4-Flash参数更小,推理能力接近Pro,适合成本敏感的场景。

DeepSeek V4模型如何实现百万上下文能力?

DeepSeek通过新的注意力机制和DSA2稀疏注意力技术,实现了百万上下文能力,显著降低了计算量和显存需求。

DeepSeek的融资情况如何?

DeepSeek获得腾讯和阿里的投资,估值超过200亿美元,显示出其技术水平的提升。

DeepSeek V4模型的API名称是什么?

新模型的API名称为deepseek-v4-pro和deepseek-v4-flash,旧接口将在三个月后停用。

DeepSeek V4模型是否支持国产芯片?

是的,DeepSeek V4模型专门针对寒武纪进行了优化,支持国产芯片。

➡️

继续阅读