利用大型语言模型进行低资源语言和高资源语言的机器翻译幻觉检测
原文中文,约400字,阅读约需1分钟。发表于: 。大型多语言机器翻译系统在提高翻译准确性方面取得了重要突破,但即使是最好的系统仍然会出现幻觉,严重影响用户的信任。使用大型语言模型和大规模多语言嵌入中的语义相似度来评估幻觉检测方法。对于高语料资源语言来说,Llama3-70B 的性能比之前的最新技术提高了 0.16 个 MCC(马修斯相关系数);然而,对于低资源语言,我们观察到 Claude Sonnet...
大型多语言机器翻译系统取得重要突破,使用大型语言模型和多语言嵌入评估幻觉检测方法。Llama3-70B在高语料资源语言上性能提高0.16个MCC,Claude Sonnet在低资源语言上相对其他模型提高0.03个MCC。大型语言模型在低资源语言方面优势较小。