小红花·文摘

本研究探讨了多语言模型在知识转移和事实回忆方面的局限性，发现其在不同语言间的知识转移效果不佳。研究提出了一个包含10,000个国家相关事实的基准，并引入新指标量化跨语言的事实回忆能力，强调模型需关注语言特定的事实可靠性。

The Factuality of Language Models Depends on the Language of Inquiry

BriefGPT - AI 论文速递 ·

本研究探讨了多语言大型语言模型在非英语中的偏见和毒性问题。通过比较微调方法，发现使用非有害文本微调能有效降低偏见，而优化数据集更能减少毒性。研究表明，英语中的缓解效果可以迁移至其他语言，但可能影响非英语的生成能力，强调了开发语言特定缓解方法的重要性。

Cross-Lingual Transfer of Debiasing and Detoxification in Multilingual Large Language Models: An Extensive Investigation

BriefGPT - AI 论文速递 ·

该研究提出了一种使用自我聊天机制生成高质量、语言特定的聊天语料库的新方法。研究者结合了生成器和嵌入器，提出了一种基于蒙板语言模型的质量评估度量方法。他们生成了意大利聊天语料库，并改进了基于翻译的英语聊天数据的Fauno语料库。使用这些语料库来微调意大利LLM可以提升语言理解和问答能力。这种方法对于发展语言特定LLM具有重要意义，特别是对于支持少数语言如意大利语的语料库。

Cerbero-7B: 通过增强对话语料库生成和评估实现语言特定 LLM 的重大进展

BriefGPT - AI 论文速递 ·