PCoQA:波斯语会话问答数据集
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本研究引入了PCoQA数据集,为会话式问答研究提供了波斯语数据集。该数据集包含9,026个背景驱动的问题,涉及提问者、回答者和维基百科文档。研究还介绍了多种基准模型的性能,并使用预训练模型提升了性能。数据集和基准模型可在Github页面获取。
🎯
关键要点
- 本研究引入了PCoQA数据集,为会话式问答研究提供波斯语数据集。
- 数据集包含9,026个背景驱动的问题,涉及提问者、回答者和维基百科文档。
- 该数据集提供了新的挑战,包括更多开放性非事实性答案、较长答案和更少的词汇重复。
- 研究介绍了多种基准模型的性能,包括基线模型和预训练模型。
- 使用预训练模型提升了性能。
- 数据集和基准模型可在Github页面获取。
➡️