无监督的上下文增强词汇简化
原文中文,约300字,阅读约需1分钟。发表于: 。我们提出了一种基于无监督学习的词汇简化方法,仅使用单语数据和预训练语言模型。根据目标词和其上下文,我们的方法基于目标上下文和从单语数据中抽样的附加上下文生成替代词。我们在 TSAR-2022 共享任务的英语、葡萄牙语和西班牙语上进行实验,并表明我们的模型在所有语言上都显著优于其他无监督系统。我们还通过与 GPT-3.5 模型组合,建立了一个新的最先进模型。最后,我们在 SWORDS...
该文介绍了一种基于无监督学习的词汇简化方法,使用单语数据和预训练语言模型。该方法基于目标上下文和抽样的附加上下文生成替代词。实验表明该模型在英语、葡萄牙语和西班牙语上都优于其他无监督系统,并与GPT-3.5模型组合建立了一个新的最先进模型。在SWORDS词汇替换数据集上评估该模型,获得了最先进的结果。