小红花·文摘

本文探讨了程序化生成关卡在训练中的应用，提升模型的泛化性能。研究表明，通过调整关卡设计和难度，可以改善性能。引入Procgen Benchmark评估强化学习的样本效率和泛化能力，发现大型模型显著提高效果。此外，提出了基于PCGRL的自动平衡方法和新的强化学习系统ReaLly Scalable RL，以解决可视化强化学习中的泛化问题。

PCGRL+: 强化学习关卡生成的规模、控制与泛化

BriefGPT - AI 论文速递 ·

本研究提出了一种自动生成3D地下车库模拟场景的方法，以支持自动驾驶技术的训练。通过程序化内容生成和深度强化学习，生成不同难度的场景，从而提高自动驾驶模型的训练效率和安全性。模拟测试在真实世界测试前至关重要，研究还探讨了协同感知和深度学习在自动驾驶中的应用。

基于编辑马尔可夫过程的感知失败场景生成加速方法

BriefGPT - AI 论文速递 ·