本研究提出了一种新框架,通过大型语言模型生成多个翻译候选,并利用反向翻译评估翻译质量。实验结果表明,模型规模与计算量的增加呈规律性,为隐性评估翻译质量提供了新方法。
完成下面两步后,将自动完成登录并继续当前操作。