为低资源语言构建高效高效的 OpenQA 系统
原文中文,约400字,阅读约需1分钟。发表于: 。在这篇论文中,我们展示了能够为低资源语言开发有效且成本低廉的 OpenQA 系统的关键要素,其中包括利用机器翻译标注数据的弱监督和目标语言中相关的非结构化知识源。我们以土耳其语为挑战性案例研究,通过 ColBERT-QA 对 SQuAD-TR 进行了调整来构建我们的 OpenQA 系统。在使用两个跨足两年的维基百科转储版本的基础上,我们与基于 BM25 和 DPR 的 QA...
本论文介绍了为低资源语言开发有效且成本低廉的OpenQA系统的关键要素,包括利用机器翻译标注数据的弱监督和目标语言中相关的非结构化知识源。通过ColBERT-QA对SQuAD-TR进行调整,构建了OpenQA系统。与BM25和DPR的QA读取器模型相比,使用两个维基百科转储版本的基础上,获得了性能提升。鼓励研究人员在其他低资源语言中构建OpenQA系统,并公开提供代码、模型和数据集。