基于技能的贝叶斯网络自动化强化学习课程设计

📝

内容提要

本研究解决了强化学习中如何自动生成课程以缩短训练时间或提高目标任务性能的问题。提出的技能-环境贝叶斯网络(SEBN)模型可预测策略在未见任务上的表现,并通过成功估计来指引下一个任务选择。实验证明,使用SEBN构建的课程在多个环境中显著优于其他基线方法。

🏷️

标签

➡️

继续阅读