重新审视全球:揭示放射学报告生成指标中的不一致性框架

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

我们提出了一种适用于放射学领域的新的自动评估度量标准,使用成功的 COMET 架构。通过在放射学知识图谱 RadGraph 上训练和发布四个面向医学的模型检查点,我们的结果表明我们的度量标准与已有度量标准呈现中高度相关性。我们证明了我们的一个检查点与使用公开可用的六个董事认证的放射科医生的注释集评估人类判断具有很高的相关性,并使用一套包含 200 份报告的数据集进行了分析,同时还与两名放射科医生在一组包含 100 份报告的集合上进行了自己的分析。结果表明我们的方法有潜在效力作为放射学特定评估度量标准。我们的代码、数据和模型检查点将公开提供。

🎯

关键要点

  • 提出了一种适用于放射学的新自动评估度量标准,使用COMET架构。
  • 在放射学知识图谱RadGraph上训练和发布了四个医学模型检查点。
  • 度量标准与已有的BERTscore、BLEU和CheXbert分数高度相关。
  • 一个检查点与六个董事认证的放射科医生的注释集评估人类判断相关性高。
  • 使用200份报告的数据集进行了分析,并与两名放射科医生在100份报告上进行了分析。
  • 结果表明该方法在放射学特定评估度量标准上具有潜在效力。
  • 代码、数据和模型检查点将公开提供。
➡️

继续阅读