BriefGPT - AI 论文速递 ·

编码器内部的语言转换：关于零翻译多语言中的表示转换

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

本文提出了一种基于状态移动距离的多对多跨语言神经机器翻译模型，能够实现零-shot 翻译。通过移除编码器层中的残差连接，模型在零翻译任务上提升了18.5个BLEU点，同时保持高质量翻译表现。研究表明，该方法在多语言翻译中显著优于传统模型，增强了语言无关性。

🎯

❓

该模型通过学习通用表示和跨映射关系，实现未经训练的语言对之间的零-shot 翻译。

移除残差连接后，模型在零翻译任务上提升了18.5个BLEU点，同时保持高质量翻译表现。

通过对隐藏层输出的详细检查，研究表明该方法能够获得更多的语言无关性。

研究表明，该方法在多语言翻译中显著优于传统模型，提升了翻译质量。

零-shot 翻译依赖于学习通用表示和跨映射关系，使得未训练的语言对之间可以进行翻译。

实验结果显示，该方法改善了语义空间的对齐和预测的一致性，显著优于基准线。

🏷️