科技论文中的自动方面提取
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该研究旨在创建自动提取俄语科技文本的工具,并提供跨领域的俄文科技文本数据集。研究者使用经过细调的多语言BERT模型提出了基准算法,用于方面提取。该模型即使在有限数量的科技领域进行了训练,也能够推广到新的领域。
🎯
关键要点
- 该研究旨在创建一个用于从任何领域的俄语科技文本中自动提取方面的工具。
- 提供了一份跨领域的俄文科技文本数据集,标注了任务、贡献、方法和结论等方面。
- 基于经过细调的多语言BERT模型提出了一个基准算法用于方面提取。
- 展示了不同领域中方面表征存在一些差异。
- 模型即使在有限数量的科技领域进行了训练,仍能够推广到新的领域。
- 跨领域实验证明了模型的推广能力。
- 代码和数据集可在指定的GitHub链接上获得。
➡️