本研究探讨了多模态大型语言模型在传统语言和视觉任务之外的应用,提出了一种将其转化为通用具身智能体的方法。研究表明,跨域数据和在线强化学习对构建通用智能体至关重要,最终模型在新任务上展现出强大的泛化能力。
完成下面两步后,将自动完成登录并继续当前操作。