本文研究了卫星转发器链路配置的优化,比较了强化学习算法PPO与模拟退火的效果。结果表明,尽管模拟退火在静态问题中表现更佳,但强化学习在优化问题上也显示出潜力,为卫星通信资源配置提供了新思路。
完成下面两步后,将自动完成登录并继续当前操作。