小红花·文摘

本文提出了一种开环强化学习范式，介绍了三种新算法，包括鲁棒的基于模型的方法和两种无模型方法。通过实证评估，展示了这些算法在振子摆起任务和高维MuJoCo任务中的显著性能提升，并探讨了强化学习的中心问题及其在实际应用中的挑战。