本研究探讨了多语言模型在知识转移和事实回忆方面的局限性,发现其在不同语言间的知识转移效果不佳。研究提出了一个包含10,000个国家相关事实的基准,并引入新指标量化跨语言的事实回忆能力,强调模型需关注语言特定的事实可靠性。
完成下面两步后,将自动完成登录并继续当前操作。