本研究提出FuxiMT,一种针对低资源环境的多语种机器翻译模型。该模型通过在大型中文语料库上预训练,并在65种语言的平行数据集上微调,展现出优越的翻译能力,尤其在缺乏平行数据时的零-shot翻译表现突出,具有实用潜力。
本研究针对多语言神经机器翻译中解码器架构的语言迁移能力不足问题,提出了一种创新方法,通过将解码过程分为两个阶段并施加对比学习,实验结果表明该方法在零-shot翻译中显著提升了性能。
本文探讨了改进Transformer模型以实现零-shot机器翻译的方法。通过移除编码器中的残差连接,模型在IWSLT 2017数据集中平均提高了2.23 BLEU分数。此外,研究提出的迭代训练过程和辅助损失方法显著提升了多语言翻译的性能,尤其在零样本翻译上表现优异。
本文提出了一种基于状态移动距离的多对多跨语言神经机器翻译模型,能够实现零-shot 翻译。通过移除编码器层中的残差连接,模型在零翻译任务上提升了18.5个BLEU点,同时保持高质量翻译表现。研究表明,该方法在多语言翻译中显著优于传统模型,增强了语言无关性。
本文研究了机器翻译的训练模型,重点关注增强多对多多语言翻译性能和零-shot翻译方向。通过在预训练的多语言大型语言模型上进行微调,并采用提示策略和跨语言一致性正则化,提高了翻译性能。实验结果表明方法有效。
完成下面两步后,将自动完成登录并继续当前操作。