开源3D医学大模型SAT,支持497类器官,性能超越72个nnU-Nets,上交大团队发布

开源3D医学大模型SAT,支持497类器官,性能超越72个nnU-Nets,上交大团队发布

💡 原文中文,约7200字,阅读约需18分钟。
📝

内容提要

上海交通大学与上海人工智能实验室联合团队发布了3D医学图像分割大模型SAT,实现对人体497种器官/病灶的通用分割。SAT通过知识注入和文本编码器实现精准编码解剖学术语,构建了多模态医疗知识图谱和最大规模的3D医学图像分割数据集SAT-DS。实验结果表明,SAT在域内和域外测试中性能接近或超过专用模型nnU-Nets和交互式模型MedSAM。SAT还可以作为大语言模型的代理工具,提供分割能力。

🎯

关键要点

  • 上海交通大学与上海人工智能实验室联合发布3D医学图像分割大模型SAT,实现对497种器官/病灶的通用分割。
  • SAT通过知识注入和文本编码器实现精准编码解剖学术语,构建了多模态医疗知识图谱和最大规模的3D医学图像分割数据集SAT-DS。
  • SAT在域内和域外测试中性能接近或超过专用模型nnU-Nets和交互式模型MedSAM。
  • SAT可以作为大语言模型的代理工具,提供分割能力。
  • 研究背景中指出传统医学图像分割模型的局限性,强调构建通用医疗人工智能工具的必要性。
  • SAT的三大贡献包括:首次将解剖学知识注入文本编码器、构建多模态医疗知识图谱、训练两款不同大小的模型SAT-Pro和SAT-Nano。
  • 数据构建方面,SAT-DS包含72个公开数据集,22186例3D图像和302033个分割标注,涵盖497个分割类别。
  • 模型架构中,SAT通过对比学习将多模态解剖学知识注入文本编码器,设计了基于文本提示的通用分割模型框架。
  • 模型测评显示SAT在域内和域外测试中均表现优异,尤其在迁移能力上超越nnU-Nets。
  • 与MedSAM的对比实验表明,SAT在大多数区域上表现更好,尤其在复杂空间关系的分割中更具优势。
  • 消融实验探讨了视觉骨干网络和文本编码器对分割性能的影响,结果显示知识注入对长尾类别的分割有明显帮助。
  • SAT可以与大语言模型结合,展示了在真实临床数据上的应用潜力。
  • SAT的研究价值体现在高效灵活的通用分割、作为基础模型的能力、基于文本提示的准确分割、与大语言模型的结合等方面。
➡️

继续阅读