飞行中应对杂乱环境的学习敏捷性适应

原文约200字,阅读约需1分钟。发表于:

通过层次学习和规划框架,利用试错和模型生成轨迹的方法,本研究通过在线无模型强化学习和预训练微调奖励机制来赋予飞行器在未知和部分可观察环境中适应敏捷性的能力,并在仿真和实际硬件验证中证明了该方法比常数敏捷度基准和替代方法在飞行效率和安全性方面的优势。

本研究使用层次学习和规划框架,通过试错和模型生成轨迹的方法,赋予飞行器在未知和部分可观察环境中适应敏捷性的能力。通过在线无模型强化学习和预训练微调奖励机制,在仿真和实际硬件验证中证明了该方法比常数敏捷度基准和替代方法更有效和安全。

相关推荐 去reddit讨论