PAQA:面向主动开放式检索的问题回答
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本论文介绍了为低资源语言开发有效且成本低廉的OpenQA系统的关键要素。通过利用机器翻译标注数据的弱监督和目标语言中的非结构化知识源,以土耳其语为案例研究,构建了OpenQA系统。与其他QA读取器模型相比,使用两个维基百科转储版本的基础上,获得了性能提升。鼓励研究人员在其他低资源语言中构建OpenQA系统,并公开提供代码、模型和数据集。
🎯
关键要点
- 论文介绍了为低资源语言开发有效且成本低廉的OpenQA系统的关键要素。
- 利用机器翻译标注数据的弱监督和目标语言中的非结构化知识源。
- 以土耳其语为案例研究,通过ColBERT-QA对SQuAD-TR进行调整构建OpenQA系统。
- 使用两个维基百科转储版本,获得了9-34%的EM得分提升和13-33%的F1得分提升。
- 鼓励研究人员在其他低资源语言中构建OpenQA系统,并公开提供代码、模型和数据集。
➡️