小红花·文摘

本文探讨了大型语言模型（LLMs）在多项选择问答（MCQA）任务中的能力提升，提出了基于LLMs的McL-KBQA框架，结合自然提示方法提高问答的有效性和泛化性能。研究指出，现有评估机制未能充分反映LLMs的真实能力，建议在使用MCQ评估前需谨慎测试模型的任务理解能力。