小红花·文摘

本文探讨了多语言词汇简化系统的研究进展，介绍了基于Transformer的模型在英语、葡萄牙语和西班牙语中的表现。研究表明，深度学习和大型语言模型在词汇简化任务中具有显著优势，并提出了未来的发展方向。

MultiLS-SP/CA：加泰罗尼亚语和西班牙语的词汇复杂性预测和词汇简化资源

BriefGPT - AI 论文速递 ·

本文探讨了一种新的预训练策略，通过继续训练 BART 模型生成简单文本，以提高简化任务的表现。研究表明，大型语言模型（LLMs）在句子简化方面优于传统方法，并提出了一种结合词汇和深度学习技术的透明文本简化流水线。实验结果显示，LLMs 在儿童教育材料生成和文本分类任务中表现出色，尤其在低资源场景下，新型词汇简化方法有效提升了性能。

简单变得更难：LLMs 在简化语料库上表现出一致的行为吗？

BriefGPT - AI 论文速递 ·

该文介绍了一种基于无监督学习的词汇简化方法，使用单语数据和预训练语言模型。该方法基于目标上下文和抽样的附加上下文生成替代词。实验表明该模型在英语、葡萄牙语和西班牙语上都优于其他无监督系统，并与GPT-3.5模型组合建立了一个新的最先进模型。在SWORDS词汇替换数据集上评估该模型，获得了最先进的结果。

无监督的上下文增强词汇简化

BriefGPT - AI 论文速递 ·