小红花·文摘

本研究提出了QualBench，这是首个针对中文大型语言模型（LLMs）的多领域问答基准，重点在于本地化评估。研究表明，中文LLM在符合资格的知识方面表现优异，为未来的多领域知识增强和垂直领域训练提供了新机遇。