PAQA:面向主动开放式检索的问题回答
原文中文,约400字,阅读约需1分钟。发表于: 。为了解决会话式搜索系统中存在的问题,本文提出了 PAQA,这是 AmbiNQ 数据集的扩展,通过考虑用户查询和文档中存在的歧义,生成相关的澄清问题,并评估各种模型以及检索过程对歧义检测和澄清问题生成的影响。
本论文介绍了为低资源语言开发有效且成本低廉的OpenQA系统的关键要素。通过利用机器翻译标注数据的弱监督和目标语言中的非结构化知识源,以土耳其语为案例研究,构建了OpenQA系统。与其他QA读取器模型相比,使用两个维基百科转储版本的基础上,获得了性能提升。鼓励研究人员在其他低资源语言中构建OpenQA系统,并公开提供代码、模型和数据集。