绿色:生成性放射学报告评估和错误标注
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
我们提出了一种适用于放射学领域的新的自动评估度量标准,使用 COMET 架构。通过在放射学知识图谱 RadGraph 上训练和发布四个面向医学的模型检查点,我们的结果表明我们的度量标准与已有度量标准呈现中高度相关性。我们的方法有潜在效力作为放射学特定评估度量标准。
🎯
关键要点
- 提出了一种适用于放射学领域的新的自动评估度量标准,使用 COMET 架构。
- 在放射学知识图谱 RadGraph 上训练和发布了四个面向医学的模型检查点。
- 度量标准与 BERTscore、BLEU 和 CheXbert 分数等已有度量标准呈现高度相关性。
- 一个检查点与六个董事认证的放射科医生的注释集评估人类判断具有很高的相关性。
- 使用包含 200 份报告的数据集进行了分析,并与两名放射科医生在 100 份报告的集合上进行了分析。
- 结果表明该方法有潜在效力作为放射学特定评估度量标准。
- 代码、数据和模型检查点将公开提供。
➡️