通过关注矩阵的拓扑分析评估变压器预测的不确定性
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究介绍了一种使用拓扑数据分析的文本分类器,通过将BERT的关注映射转换为关注图作为输入。该模型在区分垃圾邮件和普通邮件等任务上优于BERT基线,并提出了减少BERT注意力头数量的方法。研究显示,拓扑模型在对抗性攻击方面更鲁棒,是NLP领域中首次使用基于拓扑的模型来应对对抗性攻击。
🎯
关键要点
-
本研究介绍了一种使用拓扑数据分析的文本分类器。
-
该分类器使用BERT的关注映射转换为关注图作为唯一输入。
-
模型在区分垃圾邮件和普通邮件等任务上优于BERT基线。
-
提出了一种减少拓扑分类器中BERT注意力头数量的新方法。
-
拓扑模型在对抗性攻击方面表现出更高的鲁棒性。
-
这是NLP领域中首次使用基于拓扑的模型来应对对抗性攻击。
➡️