滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型
💡
原文中文,约3300字,阅读约需8分钟。
📝
内容提要
DeepSeek发布了新开源多模态模型Janus-Pro-7B,超越DALL-E 3和Stable Diffusion,导致英伟达股价暴跌17%,市值蒸发近6000亿美元。该模型通过改进训练策略,提升了视觉生成和理解能力,迅速吸引用户,服务器频繁宕机。同时,阿里更新了其模型Qwen2.5-VL,AI领域竞争加剧。
🎯
关键要点
- DeepSeek发布了新开源多模态模型Janus-Pro-7B,超越DALL-E 3和Stable Diffusion。
- 英伟达股价暴跌17%,市值蒸发近6000亿美元,创下美股单日跌幅最大纪录。
- DeepSeek模型通过改进训练策略,提升了视觉生成和理解能力,服务器频繁宕机。
- 阿里更新了其模型Qwen2.5-VL,AI领域竞争加剧。
- Janus-Pro-7B采用自回归框架,解决了视觉编码的局限性,增强了框架的灵活性。
- 模型训练分为三个阶段,调整了数据集比例以提高多模态理解性能。
- DeepSeek的低成本和高性能吸引了大量用户,迅速登顶美区苹果应用商店免费App排行第一。
- 英伟达和其他芯片巨头股价大幅下跌,Meta和OpenAI也受到影响。
- DeepSeek的成功引发了对大规模AI算力投资必要性的讨论。
- Qwen2.5-VL支持视觉理解和长视频分析,进一步加剧了市场竞争。
➡️