本研究评估了开放权重语言模型在立陶宛语、拉脱维亚语和爱沙尼亚语的本地化能力。尽管Gemma~2模型表现良好,但许多多语言模型在翻译准确性上仍存在挑战,误差率高达每20个词中有1个错误。
本研究提出了首个针对立陶宛语的开放Llama2大语言模型(LLMs),并配套提供了问答数据集和流行LLM基准的翻译。研究表明,高质量的预训练数据集对模型在语言理解任务上的高效表现至关重要。
完成下面两步后,将自动完成登录并继续当前操作。