CLEANANERCorp:识别和修正ANERcorp数据集中的错误标签
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究探讨了遥感监督框架下的命名实体识别,发现现有方法效果不佳。为解决标签噪声问题,引入了一种基于课程的正负无标记学习方法,实证结果显示其能力超越现有方法。
🎯
关键要点
- 该研究探讨了遥感监督框架下的命名实体识别。
- 主要挑战在于标签质量受损,因伪阳性、伪阴性和正类型错误等固有错误。
- 批判性评估当前DS-NER方法的效力,使用QTL真实基准数据集。
- 现有方法的性能常常达不到预期。
- 为解决标签噪声问题,引入基于课程的正负无标记学习方法(CuPUL)。
- CuPUL通过从简单且更干净的样本开始,增强模型对噪声样本的鲁棒性。
- 实证结果显示CuPUL减少噪声标签影响,超越现有方法的能力。
➡️