科技论文中的自动方面提取
原文中文,约400字,阅读约需1分钟。发表于: 。我们的研究旨在创建一个用于从任何领域的俄语科技文本中自动提取方面的工具。本文提供了一份跨领域的俄文科技文本数据集,标注了任务、贡献、方法和结论等方面,并基于经过细调的多语言 BERT 模型提出了一个基准算法用于方面提取。我们展示了不同领域中方面表征存在一些差异,但即使我们的模型仅在有限数量的科技领域进行了训练,它仍能够推广到新的领域,这一点已通过跨领域实验证明。代码和数据集可在...
该研究旨在创建自动提取俄语科技文本的工具,并提供跨领域的俄文科技文本数据集。研究者使用经过细调的多语言BERT模型提出了基准算法,用于方面提取。该模型即使在有限数量的科技领域进行了训练,也能够推广到新的领域。