CSMeD:填补自动引文筛选中系统文献综述的数据集空白
原文中文,约400字,阅读约需1分钟。发表于: 。在本研究中,我们分析引用筛选评估数据集,揭示了许多可用数据集存在的问题,例如太小、数据泄漏以及对于将自动化文献筛选系统视为分类任务而不是检索或问答任务有限适用性。为了解决这些挑战,我们介绍了 CSMeD,这是一个集合了九个公开释放的文献综述集合的元数据集,提供统一访问 325 个医学和计算机科学领域的系统化文献综述资源。此外,我们还介绍了专门用于评估全文出版物筛选任务的新数据集...
本研究分析了引用筛选评估数据集的问题,提出了CSMeD解决方案,该方案集合了九个公开释放的文献综述集合的元数据集,提供了统一访问325个医学和计算机科学领域的系统化文献综述资源。同时,还介绍了用于评估全文出版物筛选任务的新数据集CSMeD-FT,并通过实验和建立新数据集的基线展示了CSMeD的实用性。