小红花·文摘

本研究提出了一种基于ByT5和mT5架构的序列到序列模型，旨在解决卢森堡语文本中的拼写变异问题。该模型通过真实数据训练，显示出在文本规范化方面的优势，展现了在缺乏标准化数据时进行自然语言处理的潜力。

BriefGPT - AI 论文速递 ·

本研究推出了LuxBank，这是首个卢森堡语通用依赖树库，填补了该语言在句法标注方面的空白，并提供了标注指南和句法分析资源，支持拼写和语法检查工具的开发。

BriefGPT - AI 论文速递 ·