SciQAG: 自动生成科学问答数据集的框架及细粒度评估

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究提出了名为SearchQA的数据集,用于机器理解和问答,包含14万个问题-答案对,每个对平均包含49.6个片段。研究发现人类和机器在问答方面存在显著差距。

🎯

关键要点

  • 该研究提出了名为SearchQA的数据集,用于机器理解和问答。
  • SearchQA数据集包含14万个问题-答案对,每个对平均包含49.6个片段。
  • 数据集通过从J! Archive爬取的现有问题-答案配对及Google检索的文本片段进行扩充。
  • 研究显示人类和机器在问答方面存在显著差距。
  • 所提出的数据集可作为问答的基准。
➡️

继续阅读