BriefGPT - AI 论文速递 ·

基于 PID 控制的自主修复技术提升大型语言模型的鲁棒性

💡 原文中文，约1200字，阅读约需3分钟。

📝

内容提要

本文提出了一种改进的 transformer 架构，通过自我注意力增强模型的稳定性和容错能力，解决了 softmax transformer 的秩坍缩问题。同时，研究探讨了基于强化学习的 PID 控制算法在四旋翼飞行器中的应用，证明其性能优于传统 PID 控制器。

🎯

❓

通过引入自我注意力作为自主状态空间模型，控制系统对输入的干扰进行反馈控制，从而提高模型的稳定性和容错能力。

在目标分类、图像分割和语言建模等实际任务中，该模型的优势和鲁棒性得到了验证。

该算法在四旋翼飞行器的姿态和高度控制中表现优于传统 PID 控制器。

使用了适应性动量（ADAM）优化器和反向传播（BP）算法进行动态和静态增益的调整。

通过改进的 transformer 架构和自我注意力机制来增强模型的稳定性，从而解决秩坍缩问题。

提出了一种通过闭环控制方法解决神经网络鲁棒性问题的尝试，利用数据流形的几何信息和优化控制。

🏷️