小红花·文摘

本文探讨了大型语言模型（LLMs）在多语言机器翻译中的能力，尤其是在低资源语言的表现。研究表明，参考信息能显著提高翻译评估的准确性，而源语言信息有时会产生负面影响。此外，提出了基于GPT的翻译质量评估指标GEMBA，显示出在多语言评估中的优越性能，为提升LLMs在翻译任务中的应用提供了新思路。

BriefGPT - AI 论文速递 ·

该文介绍了基于GPT的翻译质量评估指标GEMBA，可用于有参照和无参照情况。研究了四个提示变体，并比较了两种方式下的性能表现，发现只能应用于GPT 3.5及以上的模型。在WMT22的Leaderboard中，GEMBA在三种语言对中表现出先进的性能。

BriefGPT - AI 论文速递 ·