从学术论文中提取研究目标、机器学习模型名称和数据集名称及其相互关系的分析:基于大型语言模型和网络分析
原文中文,约500字,阅读约需2分钟。发表于: 。本研究解决了从学术论文中提取任务、机器学习模型和数据集名称的挑战,以降低机器学习应用的学习成本。通过采用大型语言模型和网络聚类的方法,研究首次实现了这些信息的有效提取与关系分析,尤其在金融领域的应用中表现出色,揭示了最新的数据集使用情况,具有重要的应用潜力。
科学信息提取(SciIE)研究发布了新系统和基准,提出了半监督流程以实现跨模态信息提取,减轻标注成本。该流程注释文本和表格中的实体和关系,并提供了高质量基准、大型语料库和半监督注释流程。研究验证了半监督流程的有效性和效率,并探索了大型语言模型在任务中的潜在能力。