小红花·文摘

本研究提出了一种新方法，结合偏微分方程的反向反馈控制与深度强化学习，以应对空间变量引起的延迟对分布参数系统控制的挑战。通过软演员-评论家架构和深度操作网络，模拟结果表明该算法优于传统控制器。