该论文探讨了多智能体强化学习中的安全性问题,提出了基于时间逻辑的安全要求和动态屏蔽技术等多种安全保障方法,确保智能体在学习和执行阶段的安全性。实验结果表明,这些方法有效提高了安全性和收敛速度,而不影响学习质量。
完成下面两步后,将自动完成登录并继续当前操作。