本文介绍了使用Nesterov的平滑技术和Legendre-Fenchel变换将贝尔曼方程重新构成一个新的原始对偶优化问题,并开发了一个名为平滑贝尔曼误差嵌入的新算法来解决这个优化问题。该算法在几个基准控制问题中表现出色。
完成下面两步后,将自动完成登录并继续当前操作。