本研究提出了一种去中心化算法PRISM,旨在解决多任务多智能体的路径规划问题。PRISM通过快速通信共享运动约束信息,增强了合作路径规划能力,显著提高了计算效率并解决了死锁问题。
本文研究了移动代理计算任务的转移,提出了一种基于分散决策的机制,并设计了多代理在线学习算法,应用于V2X模拟中。通过深度强化学习,解决了车辆互联网中的服务卸载问题,实验结果表明该框架性能优越。此外,研究了细胞V2X通信的资源分配,提出的去中心化算法优于其他算法。
本文探讨了多智能体强化学习中的模型基础方法,提出了自适应对手推演策略优化(AORPO)和去中心化算法MATRPO,旨在提高样本效率和策略优化。这些方法在合作与竞争任务中表现优越,有效解决多智能体控制中的挑战,提升数据效率和性能。
完成下面两步后,将自动完成登录并继续当前操作。