本研究提出了一种新框架,将她夫理论应用于去中心化深度强化学习,以提高多智能体路径规划中的合作效率。实验结果表明,该方法在复杂场景下优于现有技术。
在信息不对称的情况下,开发自主代理人以制定策略并与人类合作面临挑战。我们提出了一种共享控制游戏,通过语言模块和规划模块实现有效沟通,并利用蒙特卡洛树搜索计算策略。实验结果表明,交流能够缩小信息鸿沟,提高合作效率。
本研究提出了一种合作计划优化(CaPo)方法,旨在解决大型语言模型智能体之间的合作问题。通过元计划的生成与执行两个阶段,显著提升了合作效率,实验结果表明其优于现有方法。
完成下面两步后,将自动完成登录并继续当前操作。