基于人工智能的风险意识调度用于主动去除太空 debris 任务
原文中文,约400字,阅读约需1分钟。发表于: 。本研究解决了低地球轨道 debris 增加对航天安全构成的威胁,以及主动去除 debris (ADR) 任务规划复杂性的问题。论文提出了一种基于深度强化学习的自主决策规划模型,能够训练轨道转移飞行器 (OTV) 最优去除 sequencing,并能够自主适应动态轨道条件和任务要求。该模型的应用将显著提高 ADR 任务的经济性和技术有效性。
该研究利用双层马尔可夫决策过程(MDP)框架,提高科学任务的自主规划效率。此方法能快速计算决策,处理任务延误或偏差。通过将任务规划转化为双层MDP,增强了AI解决方案的可解释性。在RoverGridWorld环境测试中,展示了计算处理能力和近似最佳策略,并强调了计算时间与策略最优性之间的权衡。