研究人员使用预训练大型语言模型(LLMs)的嵌入向量和离线强化学习,提出了一种为多机器人团队开发导航策略的方法。实验结果显示,这些策略对未见指令具有很好的泛化能力,并且生成的低延迟控制策略可以直接部署到真实机器人上。
完成下面两步后,将自动完成登录并继续当前操作。