利用深度主动学习识别公共临床笔记中的低资源运动功能信息

💡 原文中文,约600字,阅读约需2分钟。
📝

内容提要

研究者介绍了国际功能、残疾和健康分类中“移动性”领域的第一个公开注释的数据集,旨在促进从临床记录中自动提取和分析功能信息。研究者使用关键词扩展和主动学习方法构建数据集,并训练了BERT和CRF模型来提取实体。实证结果显示NER模型在提取临床文本中的移动功能信息方面具有潜力。这个公开的注释数据集将有助于进一步研究电子健康记录中的功能信息。

🎯

关键要点

  • 研究者介绍了国际功能、残疾和健康分类中“移动性”领域的第一个公开注释的数据集。
  • 该数据集旨在促进从自由文本临床记录中自动提取和分析功能信息。
  • 使用关键词扩展和主动学习方法构建候选句子池,并选择信息丰富的句子进行人工注释。
  • 最终数据集包括4,265个句子和11,784个实体,涵盖多种类型的实体。
  • 准确匹配的实体间的注释者一致性(IAA)为0.72,部分匹配的IAA为0.91。
  • 训练和评估了BERT和CRF模型,最佳F1分数分别为动作0.84,移动性0.7,辅助0.62,数量0.71。
  • 实证结果显示NER模型在提取临床文本中的移动功能信息方面具有潜力。
  • 公开的注释数据集将有助于进一步研究电子健康记录中的功能信息。
➡️

继续阅读