SEMQA: 半抽取式多源问答
原文约600字/词,阅读约需2分钟。发表于: 。最近提出的长篇问答(QA)系统,在大型语言模型(LLMs)的支持下,展示了令人期待的能力。然而,为其生成的抽象回答归因和验证可能困难,并且自动评估其准确性仍然是一个持续的挑战。在这项工作中,我们介绍了一个新的 QA 任务,通过半抽取方式总结多个多样化的来源来回答多回答问题。具体来说,半抽取多源...
该文章介绍了半抽取多源QA(SEMQA)任务,利用语言模型的先进语言生成能力的新模式回答多回答问题。作者创建了第一个这样类型的数据集QuoteSum,并在不同设置下尝试了几个LLM后发现这个任务具有挑战性。