调和:圆桌会议通过多样 LLMs 达成共识提升推理能力
原文中文,约400字,阅读约需1分钟。发表于: 。通过多轮讨论、学习说服他人并采用加权投票机制,ReConcile 提出了一种多模型多智能体框架,以改进大型语言模型的推理能力,并达到更好的共识。
该研究提出了一种新颖的多机器人协作方法,利用预训练的大型语言模型进行高层通信和低层路径规划,通过机器人之间的交流和集体推理任务策略,并生成子任务计划和任务空间路径,应用于多臂运动规划,以加速轨迹规划,并在环境中提供反馈。研究还提出了 RoCoBench,一个包含六个任务的广泛多机器人协作场景的基准测试,伴随着一个纯文本数据集用于代理表示和推理。实验证明了该方法的有效性,能够适应任务语义的变化,并且在真实世界的实验中展示了 RoCo 可以轻松地与人工智能交互。