IM-BERT: Enhancing the Robustness of BERT through the Implicit Euler Method
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出IM-BERT,通过将BERT的层视为常微分方程求解的动态系统,解决了大规模模型在有限数据集上易受对抗攻击和过拟合的问题。IM-BERT在低资源场景下显著提高了模型的对抗鲁棒性,实验表明其在AdvGLUE数据集上的性能提升约8.3%。
🎯
关键要点
- 本研究提出IM-BERT,旨在解决大规模参数模型在有限数据集上易受对抗攻击和过拟合的问题。
- IM-BERT通过将BERT的层视为常微分方程求解的动态系统,分析显式和隐式欧拉方法的数值稳定性。
- 引入了一种数值鲁棒的IM结构,显著提高了模型在低资源场景下的对抗鲁棒性。
- 实验结果显示,IM-BERT在AdvGLUE数据集上的性能提升约为8.3%,在资源匮乏情况下,准确率提高了5.9%。
➡️