小红花·文摘

本文提出了一种名为RAMRL的多模态强化学习方法，旨在解决自动驾驶中的匝道合流问题。通过无线通信和多模态观察，利用PPO学习策略模型优化合流操作，实验结果表明该算法在SUMO平台上有效且高效。此外，研究还介绍了L3IS代理，能够在动态交通中安全合流，显示出高成功率。