滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型

💡 原文中文,约3300字,阅读约需8分钟。
📝

内容提要

DeepSeek发布了新开源多模态模型Janus-Pro-7B,超越DALL-E 3和Stable Diffusion,导致英伟达股价暴跌17%,市值蒸发近6000亿美元。该模型通过改进训练策略,提升了视觉生成和理解能力,迅速吸引用户,服务器频繁宕机。同时,阿里更新了其模型Qwen2.5-VL,AI领域竞争加剧。

🎯

关键要点

  • DeepSeek发布了新开源多模态模型Janus-Pro-7B,超越DALL-E 3和Stable Diffusion。

  • 英伟达股价暴跌17%,市值蒸发近6000亿美元,创下美股单日跌幅最大纪录。

  • DeepSeek模型通过改进训练策略,提升了视觉生成和理解能力,服务器频繁宕机。

  • 阿里更新了其模型Qwen2.5-VL,AI领域竞争加剧。

  • Janus-Pro-7B采用自回归框架,解决了视觉编码的局限性,增强了框架的灵活性。

  • 模型训练分为三个阶段,调整了数据集比例以提高多模态理解性能。

  • DeepSeek的低成本和高性能吸引了大量用户,迅速登顶美区苹果应用商店免费App排行第一。

  • 英伟达和其他芯片巨头股价大幅下跌,Meta和OpenAI也受到影响。

  • DeepSeek的成功引发了对大规模AI算力投资必要性的讨论。

  • Qwen2.5-VL支持视觉理解和长视频分析,进一步加剧了市场竞争。

延伸问答

DeepSeek的新模型Janus-Pro-7B有什么特点?

Janus-Pro-7B是一个多模态模型,超越了DALL-E 3和Stable Diffusion,采用自回归框架,提升了视觉生成和理解能力。

英伟达的股价为何会暴跌?

英伟达股价暴跌17%,市值蒸发近6000亿美元,主要是因为DeepSeek发布的新模型对市场产生了重大影响。

DeepSeek的模型训练策略有哪些改进?

DeepSeek在模型训练中增加了第一阶段的训练步骤,并调整了不同类型数据集的数据比例,以提高多模态理解性能。

阿里更新的Qwen2.5-VL模型有什么新功能?

Qwen2.5-VL支持视觉理解、长视频分析和结构化输出,增强了其在AI领域的竞争力。

DeepSeek的成功对AI行业有什么影响?

DeepSeek的成功引发了对大规模AI算力投资必要性的讨论,并导致其他芯片巨头股价大幅下跌。

DeepSeek是如何吸引大量用户的?

DeepSeek以低成本和高性能吸引用户,且其应用在美区苹果商店免费App排行中迅速登顶。

➡️

继续阅读