本文探讨了大型语言模型(LLMs)在多语言机器翻译中的能力,尤其是在低资源语言的表现。研究表明,参考信息能显著提高翻译评估的准确性,而源语言信息有时会产生负面影响。此外,提出了基于GPT的翻译质量评估指标GEMBA,显示出在多语言评估中的优越性能,为提升LLMs在翻译任务中的应用提供了新思路。
该文介绍了基于GPT的翻译质量评估指标GEMBA,可用于有参照和无参照情况。研究了四个提示变体,并比较了两种方式下的性能表现,发现只能应用于GPT 3.5及以上的模型。在WMT22的Leaderboard中,GEMBA在三种语言对中表现出先进的性能。
完成下面两步后,将自动完成登录并继续当前操作。