本文介绍了一种可持续的多智能体深度强化学习框架,能够将训练策略从模拟环境转移到真实环境中。通过实验,展示了该框架在交叉路口问题和对抗自主赛车问题上的实验结果,并讨论了加速多智能体强化学习训练的技术。最后,使用该框架展示了从模拟环境到真实环境中训练策略的过渡。
该文章介绍了一个用于管理交通基础设施系统的多智能体深度强化学习框架,通过解决不确定性、风险和资源有限性的问题,优化了交通基础设施的管理。该框架在美国弗吉尼亚州的一个交通网络应用中展示了优越的性能,通过开发一种名为DDMAC-CTDE的方法,提供了近乎最优的解决方案。
完成下面两步后,将自动完成登录并继续当前操作。