从 LLM 到 NMT:借助 Claude 推动低资源机器翻译的发展
原文中文,约400字,阅读约需1分钟。发表于: 。Anthropic 在 2024 年 3 月发布的大型语言模型 Claude 3 Opus 在机器翻译方面表现出比其他语言模型更强的能力。虽然我们发现 Claude 在 FLORES-200 上存在数据污染的证据,但我们整理了新的基准数据,证实了 Claude 在对英语进行低资源机器翻译方面的有效性。我们发现 Claude 具有显著的资源效率 -...
Anthropic的大型语言模型Claude 3 Opus在机器翻译中表现优于其他模型。尽管FLORES-200存在数据污染的证据,但新的基准数据证实了Claude在低资源机器翻译英语方面的有效性。Claude展示了显著的资源效率,翻译模型质量取决于资源水平。LLM翻译的进展可以压缩到传统的神经机器翻译(NMT)模型中。使用Claude的合成数据进行约鲁巴语-英语翻译的知识蒸馏达到或超过了NLLB-54B和Google翻译等强基准。