输入凸 LSTM: 一种基于凸优化的快速 Lyapunov 模型预测控制方法
原文中文,约300字,阅读约需1分钟。发表于: 。该研究基于输入凸神经网络(ICNN),提出了一种用于基于 Lyapunov 的 MPC 的新型输入凸 LSTM,旨在减少收敛时间、缓解梯度消失问题并确保闭环稳定性。模拟非线性化学反应器实验结果显示,相对于基准普通循环神经网络、普通 LSTM 和输入凸循环神经网络,梯度消失问题减轻并且收敛时间分别降低了 46.7%、31.3% 和 20.2%。
本文介绍了一种强化学习方法,使用递归卷积神经网络(RCNNs)进行值迭代和状态信念传递,以适应部分可观测环境。该方法通过回传梯度学习MDP模型和奖励函数,是传统基于模型RL的有效替代。通过机器人规划仿真验证了算法,证明了其降低规划成本、学习准确MDP模型和实现近最优策略的能力。