小红花·文摘

本文研究了光学卫星通信中的自适应光学系统，提出通过强化学习降低系统延迟、体积和成本。与低成本光电二极管互动，开发了AO RL环境以评估性能。实证分析表明，PPO算法优于其他方法，训练后收敛至最大奖励的86％，显示出强化学习在该领域的潜力。