小红花·文摘

研究探讨了强化学习中的迁移学习，将降维系统的策略应用于全状态系统。通过级联动态模型，忽略部分状态动态，用经典控制器确保内环稳定性。实验表明该方法在无人机控制中有效。