InDRiVE:基于内在分歧的强化学习用于通过好奇心驱动的通用世界模型进行车辆探索

📝

内容提要

本研究解决了现有模型基础强化学习在自主驾驶任务中通用性不足的问题,提出了InDRiVE方法,该方法利用基于内在分歧的奖励,在不依赖任务特定反馈的情况下,推动车辆对环境中高不确定性区域的主动探索。实验结果表明,InDRiVE在训练步骤显著减少的情况下,能够在各种环境中实现更高的成功率,突显了纯内在探索在学习稳健车辆控制行为中的有效性。

🏷️

标签

➡️

继续阅读