PCoQA:波斯语会话问答数据集

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本研究引入了PCoQA数据集,为会话式问答研究提供了波斯语数据集。该数据集包含9,026个背景驱动的问题,涉及提问者、回答者和维基百科文档。研究还介绍了多种基准模型的性能,并使用预训练模型提升了性能。数据集和基准模型可在Github页面获取。

🎯

关键要点

  • 本研究引入了PCoQA数据集,为会话式问答研究提供波斯语数据集。
  • 数据集包含9,026个背景驱动的问题,涉及提问者、回答者和维基百科文档。
  • 该数据集提供了新的挑战,包括更多开放性非事实性答案、较长答案和更少的词汇重复。
  • 研究介绍了多种基准模型的性能,包括基线模型和预训练模型。
  • 使用预训练模型提升了性能。
  • 数据集和基准模型可在Github页面获取。
➡️

继续阅读