马拉地英语混合文本生成

原文约300字,阅读约需1分钟。发表于:

该研究提出了一种用于生成马拉地语 - 英语混合文本的算法,并通过 Code Mixing Index(CMI)和 Degree of Code Mixing(DCM)指标进行评估,结果表明该算法能够生成有效和可理解的混合语句子,为多语社会中的语言差距提供了潜在的增强 NLP 工具的可能性。

该研究提出了多种模型来解决单语英文到Hinglish的翻译问题,其中使用mT5和mBART Transformer-based编码器-解码器模型表现良好。同时,提出了一种生成混合编码文本的无依存方法,并采用课程学习方法来提高语言模型性能。在英语-Hinglish官方共享任务中,该模型效果最佳。

相关推荐 去reddit讨论