本研究探讨大型语言模型(LLMs)在问答任务中的表现,提出单次推理提问方式以更有效处理不可回答的问题。结果表明,尽管小型微调模型在特定任务中表现更佳,但LLM在不同数据集上的泛化能力更强。
完成下面两步后,将自动完成登录并继续当前操作。