Neural Lyapunov Function Approximation Based on Self-Supervised Reinforcement Learning
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新方法,通过自监督强化学习提高非线性系统中李雅普诺夫函数的推导效率,结果表明其在机器人任务中收敛速度更快、近似精度更高。
🎯
关键要点
- 本研究提出了一种新方法,旨在提高非线性系统中李雅普诺夫函数的推导效率。
- 该方法采用自监督强化学习,提升训练数据生成的样本效率。
- 特别针对状态空间中不准确表示的区域进行优化。
- 所提方法在标准和目标条件下的机器人任务中经过验证。
- 结果显示该方法比现有的神经李雅普诺夫近似方法具有更快的收敛速度和更高的近似精度。
➡️