小红花·文摘

本文研究了大型语言模型在回答事实型问题时的性能，提出了新的基准和评估方法。实验证明，模型在生成答案的真实性上存在挑战，尤其是在低资源语言中。研究探讨了如何利用语言模型的知识进行事实检查，并提出了改进模型性能的建议。