通过关注矩阵的拓扑分析评估变压器预测的不确定性

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究介绍了一种使用拓扑数据分析的文本分类器,通过将BERT的关注映射转换为关注图作为输入。该模型在区分垃圾邮件和普通邮件等任务上优于BERT基线,并提出了减少BERT注意力头数量的方法。研究显示,拓扑模型在对抗性攻击方面更鲁棒,是NLP领域中首次使用基于拓扑的模型来应对对抗性攻击。

🎯

关键要点

  • 本研究介绍了一种使用拓扑数据分析的文本分类器。

  • 该分类器使用BERT的关注映射转换为关注图作为唯一输入。

  • 模型在区分垃圾邮件和普通邮件等任务上优于BERT基线。

  • 提出了一种减少拓扑分类器中BERT注意力头数量的新方法。

  • 拓扑模型在对抗性攻击方面表现出更高的鲁棒性。

  • 这是NLP领域中首次使用基于拓扑的模型来应对对抗性攻击。

➡️

继续阅读