利用 BERT 语言模型进行多语言 ESG 问题识别

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

本文通过构建引用网络和分析ESG元素,对分布式账本技术(DLTs)在环境可持续性和治理(ESG)领域的研究进行了综述。研究者选择了107篇种子论文,提取出505篇关键论文,并提供了一个专为DLT和ESG相关研究设计的命名实体识别数据集。

🎯

关键要点

  • 分布式账本技术 (DLTs) 需要深入了解其环境可持续性和治理 (ESG) 组成部分。
  • 目前缺乏针对 DLT 的 ESG 领域的系统文献综述。
  • 研究者选择了 107 篇种子论文,构建了一个包含 63,083 个参考文献的引用网络。
  • 引用网络被精简为 24,539 篇出版物进行分析。
  • 根据技术分类体系,用 12 个顶级类别对 46 篇论文中的命名实体进行了标记。
  • 利用基于转换器的语言模型进行命名实体识别 (NER) 任务的微调。
  • 从整个语料库中提炼出 505 篇关键论文,进行文献综述。
  • 提出了一种机器学习驱动的系统文献综述方法,强调 ESG 方面。
  • 提供了首个专为 DLT 和 ESG 相关研究设计的命名实体识别数据集,包含 54,808 个命名实体。
➡️

继续阅读