PCoQA:波斯语会话问答数据集
原文中文,约400字,阅读约需1分钟。发表于: 。通过引入 PCoQA 数据集,本研究旨在为会话式问答研究提供第一个波斯语会话式问答数据集,包含多达 9,026 个背景驱动的问题,涉及提问者、回答者和维基百科文档。该数据集对以往问答数据集提供了新的挑战,包括更多开放性非事实性答案、较长答案和更少的词汇重复。本文还介绍了多种基准模型的性能,包括基线模型和预训练模型,并使用预训练模型提升了性能。有关数据集和基准模型可在我们的 Github 页面上获取。
本研究引入了PCoQA数据集,为会话式问答研究提供了波斯语数据集。该数据集包含9,026个背景驱动的问题,涉及提问者、回答者和维基百科文档。研究还介绍了多种基准模型的性能,并使用预训练模型提升了性能。数据集和基准模型可在Github页面获取。