本研究提出了QualBench,这是首个针对中文大型语言模型(LLMs)的多领域问答基准,重点在于本地化评估。研究表明,中文LLM在符合资格的知识方面表现优异,为未来的多领域知识增强和垂直领域训练提供了新机遇。
完成下面两步后,将自动完成登录并继续当前操作。