本文探讨了多语言词汇简化系统的研究进展,介绍了基于Transformer的模型在英语、葡萄牙语和西班牙语中的表现。研究表明,深度学习和大型语言模型在词汇简化任务中具有显著优势,并提出了未来的发展方向。
本文探讨了一种新的预训练策略,通过继续训练 BART 模型生成简单文本,以提高简化任务的表现。研究表明,大型语言模型(LLMs)在句子简化方面优于传统方法,并提出了一种结合词汇和深度学习技术的透明文本简化流水线。实验结果显示,LLMs 在儿童教育材料生成和文本分类任务中表现出色,尤其在低资源场景下,新型词汇简化方法有效提升了性能。
该文介绍了一种基于无监督学习的词汇简化方法,使用单语数据和预训练语言模型。该方法基于目标上下文和抽样的附加上下文生成替代词。实验表明该模型在英语、葡萄牙语和西班牙语上都优于其他无监督系统,并与GPT-3.5模型组合建立了一个新的最先进模型。在SWORDS词汇替换数据集上评估该模型,获得了最先进的结果。
完成下面两步后,将自动完成登录并继续当前操作。