重新审视太空任务规划:一种基于强化学习的多碎片会合方法

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了一种基于深度强化学习的masked PPO算法,用于优化太空碎片会合任务的规划效率。通过优化碎片访问顺序,任务总时间比遗传算法和贪婪算法分别减少约10.96%和13.66%。这一创新为太空碎片清除任务提供了新思路。

🎯

关键要点

  • 本研究提出了一种基于深度强化学习的masked PPO算法。
  • 该算法用于优化太空碎片会合任务的规划效率。
  • 通过优化碎片访问顺序,任务总时间显著缩短。
  • 与遗传算法相比,任务总时间减少约10.96%。
  • 与贪婪算法相比,任务总时间减少约13.66%。
  • 这一创新为太空碎片清除任务提供了新思路。
➡️

继续阅读