基于 PID 控制的自主修复技术提升大型语言模型的鲁棒性

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文研究了基于强化学习的神经网络自整定的PID控制算法在四旋翼飞行器的姿态和高度控制中的应用。使用适应性动量优化器和反向传播算法进行动态和静态增益的调整,证明该方法比具有恒定增益的PID控制器性能更好。

🎯

关键要点

  • 研究基于强化学习的神经网络自整定的PID控制算法。
  • 应用于四旋翼飞行器的姿态和高度控制。
  • 使用适应性动量优化器(ADAM)和反向传播算法进行增益调整。
  • 该方法性能优于具有恒定增益的PID控制器。
➡️

继续阅读