小红花·文摘

研究人员使用预训练大型语言模型（LLMs）的嵌入向量和离线强化学习，提出了一种为多机器人团队开发导航策略的方法。实验结果显示，这些策略对未见指令具有很好的泛化能力，并且生成的低延迟控制策略可以直接部署到真实机器人上。