小红花·文摘

本研究探讨大型语言模型（LLMs）在问答任务中的表现，提出单次推理提问方式以更有效处理不可回答的问题。结果表明，尽管小型微调模型在特定任务中表现更佳，但LLM在不同数据集上的泛化能力更强。