Yann LeCun指出当前的LLM无法理解世界,强调世界模型的重要性。他的团队推出了DINO-WM,该模型基于预训练视觉特征实现零样本规划,能够有效建模环境动态,提升视觉推理能力。在复杂环境中,该模型展现出更强的场景理解能力。
该研究提出DINO-WM方法,利用DINOv2特征从离线轨迹中学习,解决世界模型学习的挑战,实现无任务依赖的行为规划,展现出良好的适应性和推广性。
完成下面两步后,将自动完成登录并继续当前操作。