本研究提出了一种基于深度强化学习的masked PPO算法,用于优化太空碎片会合任务的规划效率。通过优化碎片访问顺序,任务总时间比遗传算法和贪婪算法分别减少约10.96%和13.66%。这一创新为太空碎片清除任务提供了新思路。
本文讨论了移动计算中的探索和会合问题,提出了深度优先搜索变体和改进的会合算法。同时涉及多智能体路径规划、图搜索问题算法和多智能体合作探索等相关内容。
完成下面两步后,将自动完成登录并继续当前操作。