小红花·文摘

本研究探讨了视觉语言模型（VLMs）在空间任务中的应用，提出将VLM与模拟环境和机器人系统结合的方法。研究表明，VLM能够处理视觉和文本数据，生成操作决策，并在模拟任务中表现出与传统方法的竞争力，显示出实际应用的潜力。