大模型的进化方向:Words to Worlds | 对话商汤林达华
💡
原文中文,约4400字,阅读约需11分钟。
📝
内容提要
商汤科技的SenseNova-SI模型在空间智能领域超越了李飞飞团队的Cambrian-S,标志着AI技术的转变。林达华指出,未来AI应从语言模型转向多模态理解,以更好地理解物理世界。商汤通过原生多模态架构NEO,实现了数据效率提升和空间智能的突破,推动了AI的实际应用。
🎯
关键要点
- 商汤科技的SenseNova-SI模型在空间智能领域超越了李飞飞团队的Cambrian-S。
- 林达华认为未来AI应从语言模型转向多模态理解,以更好地理解物理世界。
- 商汤通过原生多模态架构NEO,实现了数据效率提升和空间智能的突破。
- AI行业经历了从依赖参数规模到回归科研本质的转变。
- 当前的多模态大模型存在局限性,无法真正理解三维空间关系。
- 商汤的NEO架构允许视觉和语言信号同时处理,提升了模型的理解能力。
- SenseNova-SI模型在训练数据使用上效率提升了10倍,达到了SOTA水平。
- 商汤强调技术必须具备工业应用价值,降低使用成本是关键。
- 商汤通过算法蒸馏技术显著提升了视频生成的效率。
- 林达华建议年轻研究者关注更广泛的AI领域,而不仅仅是大语言模型。
➡️