本文探讨了多语言神经机器翻译中的零样本翻译问题,提出了辅助损失、解码器参数共享和语言特定组件等改进方法。这些方法有效提升了翻译性能,尤其在零样本任务中显著提高了BLEU分数,接近传统方法的效果。
研究发现,目标端扰动对翻译质量影响大,上下文学习提供重要信号。Zero-Shot-Context方法可自动添加信号,提高GPT-3零样本翻译性能,与少样本提示有竞争力。
本文研究了多语言NMT模型的解码器参数的共享方法,并评估了完全监督和零样本翻译性能。发现在具有任务特定解码器参数的模型中,优于在所有任务上完全共享解码器参数的模型。
完成下面两步后,将自动完成登录并继续当前操作。