本研究提出了一种基于T5架构的文本生成模型,旨在解决卢森堡语数据稀缺的问题。通过结合德语和法语数据,该模型在生成卢森堡语文本时优于单语模型,并使用LuxGen基准进行评估。
本研究提出了一种基于ByT5和mT5架构的序列到序列模型,旨在解决卢森堡语文本中的拼写变异问题。该模型通过真实数据训练,显示出在文本规范化方面的优势,展现了在缺乏标准化数据时进行自然语言处理的潜力。
本研究推出了LuxBank,这是首个卢森堡语通用依赖树库,填补了该语言在句法标注方面的空白,并提供了标注指南和句法分析资源,支持拼写和语法检查工具的开发。
完成下面两步后,将自动完成登录并继续当前操作。