本文研究了光学卫星通信中的自适应光学系统,提出通过强化学习降低系统延迟、体积和成本。与低成本光电二极管互动,开发了AO RL环境以评估性能。实证分析表明,PPO算法优于其他方法,训练后收敛至最大奖励的86%,显示出强化学习在该领域的潜力。
完成下面两步后,将自动完成登录并继续当前操作。