TACRED 关系分类数据集中的噪声:特征化与减少

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文研究了TACRED数据集中噪声的原因,并提出了基于最近邻的策略来识别和剔除噪声实例。实验证明,使用这些策略进行模型再训练可以显著提高性能。

🎯

关键要点

  • 本文研究了TACRED数据集中噪声的原因。
  • 噪声主要来自被标记为无关系的实例。
  • 提出了两种基于最近邻的策略来识别噪声实例。
  • 这些策略可以用于剔除和重新注释噪声实例。
  • 实验证明,基于这些策略进行的模型再训练显著提高了性能。
➡️

继续阅读