基于分布式表面形式的多智能体安全最优控制问题的解决 本研究解决了多机器人系统在协同实现团队目标时的安全控制问题,尤其是在传统算法训练不稳定的情况下。通过引入约束优化的表面形式,并提出了一种新颖的集中训练和分布执行的多智能体强化学习算法Def-MARL,该方法在多个任务中展现出最佳性能且保证安全约束。通过真实硬件实验,验证了Def-MARL安全协调智能体完成复杂任务的能力。 多智能体 安全