大型语言模型是否有英语口音？评估和改善多语言大型语言模型的自然性

Current Large Language Models (LLMs) are predominantly designed with English as the primary language, and even the few that are multilingual tend to exhibit strong English-centric biases. Much...

当前大型语言模型主要以英语为主，导致多语言输出不自然。本文提出新的自动化语料库评估指标，评估多语言环境下LLM输出的自然性，并在法语和中文中进行测试，发现英语影响的模式。为改善这一问题，提出了一种简单有效的对齐方法，提升目标语言的自然性，同时不影响通用基准的表现。

多语言大型语言模型对齐方法自然性评估指标