本研究提出了一种新方法,结合偏微分方程的反向反馈控制与深度强化学习,以应对空间变量引起的延迟对分布参数系统控制的挑战。通过软演员-评论家架构和深度操作网络,模拟结果表明该算法优于传统控制器。
该文提出了两种基于随机神经网络解决高维偏微分方程的方法,避免了维度增加引发的指数级增长。这些方法在多个高维PDE上展示了良好性能,成本效益高且更准确。
完成下面两步后,将自动完成登录并继续当前操作。