本研究探讨了多语言模型在知识转移和事实回忆方面的局限性,发现其在不同语言间的知识转移效果不佳。研究提出了一个包含10,000个国家相关事实的基准,并引入新指标量化跨语言的事实回忆能力,强调模型需关注语言特定的事实可靠性。
本研究探讨了多语言大型语言模型在非英语中的偏见和毒性问题。通过比较微调方法,发现使用非有害文本微调能有效降低偏见,而优化数据集更能减少毒性。研究表明,英语中的缓解效果可以迁移至其他语言,但可能影响非英语的生成能力,强调了开发语言特定缓解方法的重要性。
该研究提出了一种使用自我聊天机制生成高质量、语言特定的聊天语料库的新方法。研究者结合了生成器和嵌入器,提出了一种基于蒙板语言模型的质量评估度量方法。他们生成了意大利聊天语料库,并改进了基于翻译的英语聊天数据的Fauno语料库。使用这些语料库来微调意大利LLM可以提升语言理解和问答能力。这种方法对于发展语言特定LLM具有重要意义,特别是对于支持少数语言如意大利语的语料库。
完成下面两步后,将自动完成登录并继续当前操作。