SciQAG: 自动生成科学问答数据集的框架及细粒度评估
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究提出了名为SearchQA的数据集,用于机器理解和问答,包含14万个问题-答案对,每个对平均包含49.6个片段。研究发现人类和机器在问答方面存在显著差距。
🎯
关键要点
- 该研究提出了名为SearchQA的数据集,用于机器理解和问答。
- SearchQA数据集包含14万个问题-答案对,每个对平均包含49.6个片段。
- 数据集通过从J! Archive爬取的现有问题-答案配对及Google检索的文本片段进行扩充。
- 研究显示人类和机器在问答方面存在显著差距。
- 所提出的数据集可作为问答的基准。
➡️