COMET是一个使用神经网络的多语言机器翻译评估模型,通过跨语言预训练语言建模来提高机器翻译的质量。在WMT 2019指标共享任务中表现出色。
这篇文章介绍了一种名为MeritFed的个性化联邦学习算法,适用于自然语言任务中的异构数据。作者使用多语言机器翻译共享任务的数据集和萨米语进行评估,结果显示目标数据集大小影响辅助语言之间的权重分布,无关语言不会干扰训练。该方法简单易用,只需几行代码,并提供了实验重现的脚本。
本文研究了自监督学习方法在多语言机器翻译中的应用。通过结合噪声消除的自监督任务和原有任务,性能在8种和15种语言基准测试中分别提高了11.3%和3.7%。
多语言机器翻译质量低,英文内容通过机器翻译转译成较低资源语言。研究对训练多语言大型语言模型提出疑虑。
完成下面两步后,将自动完成登录并继续当前操作。