本研究提出了一种新方法,开发了适用于斯洛文尼亚语的生成模型GaMS 1B,旨在解决大型语言模型在低资源语言上的局限性。通过对英语OPT模型的预训练,GaMS在句子简化任务中表现优异,展现了应用潜力。
本文介绍了多个西班牙语自然语言处理研究,包括IMPACT-es语料库、无监督句子简化系统MUSS、医学语言模型及其评估,以及西班牙语金融文本简化数据集的开发。研究强调了特定领域预训练的重要性,并展示了多语言模型与西班牙语特定模型的性能对比,旨在推动西班牙语处理技术的发展。
该文介绍了一种基于编辑的无监督句子简化方法,通过评分函数进行指导,迭代执行单词和短语级别的编辑。实验表明,该方法几乎与最先进的监督方法一样有效。
完成下面两步后,将自动完成登录并继续当前操作。