Apple Machine Learning Research ·

大型语言模型是否有英语口音？评估和改善多语言大型语言模型的自然性

💡 原文英文，约200词，阅读约需1分钟。

📝

内容提要

当前大型语言模型主要以英语为主，导致多语言输出不自然。本文提出新的自动化语料库评估指标，评估多语言环境下LLM输出的自然性，并在法语和中文中进行测试，发现英语影响的模式。为改善这一问题，提出了一种简单有效的对齐方法，提升目标语言的自然性，同时不影响通用基准的表现。

🎯

🔎

当前大型语言模型在多语言环境中的表现受到英语主导的影响，导致非英语语言的输出往往不自然。这种现象不仅影响了用户体验，也限制了模型在全球范围内的应用潜力。开发更具自然性的多语言模型是未来研究的重要方向。

文章提出的新自动化语料库评估指标为多语言模型的自然性提供了量化标准。这些指标的引入有助于研究人员更准确地识别和解决语言模型在不同语言中的表现差异，从而推动多语言模型的进一步优化。

提出的对齐方法能够有效提升目标语言的自然性，同时保持通用基准的表现。这一方法的成功应用表明，在多语言模型的开发中，针对特定语言的优化策略是可行的，未来可以为其他语言的自然性提升提供借鉴。

❓

大型语言模型在多语言输出中常常表现出不自然的特征，主要是因为它们以英语为主，导致在其他语言中产生英语影响的模式。

本文提出了新的自动化语料库评估指标，用于评估多语言环境下大型语言模型输出的词汇和句法自然性。

研究中对法语和中文进行了测试，以评估大型语言模型的自然性。

提出了一种简单有效的对齐方法，可以提升目标语言的自然性，同时不影响通用基准的表现。

开发多语言指标和资源对于新一波多语言大型语言模型的有效性和自然性至关重要。

大型语言模型在生成非英语语言时，常常反映出英语的词汇和语法模式，导致输出不自然。

🏷️