BriefGPT - AI 论文速递 ·

自动驾驶中的安全多智能体强化学习与双层优化

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

本文探讨了深度学习中的多智能体强化学习（c-MARL）安全性问题，提出了鲁棒性测试框架MARLSafe，强调提高算法鲁棒性的必要性。研究展示了通过多智能体框架提升连接和自主车辆系统安全性的方法，实验结果表明这些方法显著提高了系统的安全性和效率。

🎯

❓

MARLSafe框架是一种用于c-MARL算法的鲁棒性测试工具，能够从状态、行动和奖励三个方面全面测试算法的鲁棒性。

通过使用多智能体强化学习框架和Graph Convolutional Network-Transformer作为空间-时间编码器，可以在复杂驾驶情况下显著提高连接和自主车辆系统的安全性和效率。

混合方法结合了多智能体增强学习和控制理论，旨在解决安全关键环境中的复杂合作任务，并动态调整智能体位置以保持安全条件。

实验结果表明，许多最新的c-MARL算法在状态、行动和奖励方面的鲁棒性都较低，强调了提高鲁棒性的必要性。

研究提出了两种安全性保障方法，这些方法可以在不损害智能体学习质量的情况下保证其安全，尤其是基于因式分解的屏蔽方法在智能体数量上更具可扩展性。

将安全控制与学习方法相结合，可以增强安全合规性，同时实现良好的任务目标性能，尤其在复杂合作任务中表现显著。

🏷️