滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型
内容提要
DeepSeek发布了新开源多模态模型Janus-Pro-7B,超越DALL-E 3和Stable Diffusion,导致英伟达股价暴跌17%,市值蒸发近6000亿美元。该模型通过改进训练策略,提升了视觉生成和理解能力,迅速吸引用户,服务器频繁宕机。同时,阿里更新了其模型Qwen2.5-VL,AI领域竞争加剧。
关键要点
-
DeepSeek发布了新开源多模态模型Janus-Pro-7B,超越DALL-E 3和Stable Diffusion。
-
英伟达股价暴跌17%,市值蒸发近6000亿美元,创下美股单日跌幅最大纪录。
-
DeepSeek模型通过改进训练策略,提升了视觉生成和理解能力,服务器频繁宕机。
-
阿里更新了其模型Qwen2.5-VL,AI领域竞争加剧。
-
Janus-Pro-7B采用自回归框架,解决了视觉编码的局限性,增强了框架的灵活性。
-
模型训练分为三个阶段,调整了数据集比例以提高多模态理解性能。
-
DeepSeek的低成本和高性能吸引了大量用户,迅速登顶美区苹果应用商店免费App排行第一。
-
英伟达和其他芯片巨头股价大幅下跌,Meta和OpenAI也受到影响。
-
DeepSeek的成功引发了对大规模AI算力投资必要性的讨论。
-
Qwen2.5-VL支持视觉理解和长视频分析,进一步加剧了市场竞争。
延伸问答
DeepSeek的新模型Janus-Pro-7B有什么特点?
Janus-Pro-7B是一个多模态模型,超越了DALL-E 3和Stable Diffusion,采用自回归框架,提升了视觉生成和理解能力。
英伟达的股价为何会暴跌?
英伟达股价暴跌17%,市值蒸发近6000亿美元,主要是因为DeepSeek发布的新模型对市场产生了重大影响。
DeepSeek的模型训练策略有哪些改进?
DeepSeek在模型训练中增加了第一阶段的训练步骤,并调整了不同类型数据集的数据比例,以提高多模态理解性能。
阿里更新的Qwen2.5-VL模型有什么新功能?
Qwen2.5-VL支持视觉理解、长视频分析和结构化输出,增强了其在AI领域的竞争力。
DeepSeek的成功对AI行业有什么影响?
DeepSeek的成功引发了对大规模AI算力投资必要性的讨论,并导致其他芯片巨头股价大幅下跌。
DeepSeek是如何吸引大量用户的?
DeepSeek以低成本和高性能吸引用户,且其应用在美区苹果商店免费App排行中迅速登顶。