NoiseBench: 命名实体识别中真实标签噪声对性能的基准测试
原文中文,约200字,阅读约需1分钟。发表于: 。提出了一个包含 6 种真实噪音的 NER 基准,证明真实噪音比模拟噪音更具挑战性,并展示当前最先进的噪音鲁棒学习模型远未达到其理论可达的上限。
该研究提出了一种基于本地和全局独立性假设的置信得分估计策略,结合CRF模型来提高深度学习在命名实体识别中的性能。实验证明该方法在不同语言和标注场景下都有效。
提出了一个包含 6 种真实噪音的 NER 基准,证明真实噪音比模拟噪音更具挑战性,并展示当前最先进的噪音鲁棒学习模型远未达到其理论可达的上限。
该研究提出了一种基于本地和全局独立性假设的置信得分估计策略,结合CRF模型来提高深度学习在命名实体识别中的性能。实验证明该方法在不同语言和标注场景下都有效。