机器之心 ·

基于文本提示的3D医疗图像通用分割大模型

💡 原文中文，约7300字，阅读约需18分钟。

📝

内容提要

上海交通大学与上海人工智能实验室联合发布了SAT项目，利用文本提示在3D医学图像上实现了对497种器官/病灶的通用分割。研究团队构建了多模态医疗知识图谱和最大规模的3D医学图像分割数据集SAT-DS。通过SAT-DS，研究团队验证了SAT在分割性能、泛化能力和精准度等方面的优势。SAT还可作为大语言模型的代理工具，实现在临床数据上的定位和分割能力。

🎯

关键要点

上海交通大学与上海人工智能实验室联合发布SAT项目，实现对497种器官/病灶的3D医学图像通用分割。
SAT项目利用文本提示进行分割，所有数据和代码均已开源。
传统医学图像分割模型依赖于专用模型，应用范围有限，无法满足多样化需求。
SAT项目构建了包含6K+人体解剖学概念的多模态医疗知识图谱和最大规模的3D医学图像分割数据集SAT-DS。
SAT在分割性能、泛化能力和精准度方面优于传统模型nnU-Nets和交互式模型MedSAM。
SAT可以作为大语言模型的代理工具，实现在临床数据上的定位和分割能力。
研究团队通过对比实验验证了SAT的性能，SAT-Pro和SAT-Nano在多个区域的表现接近或超越nnU-Nets。
SAT的构建包括知识注入和基于文本提示的分割模型框架。
消融实验表明，知识注入和选择合适的视觉骨干网络对分割性能有显著影响。
SAT能够处理长尾类别的分割任务，特别是在尾部类上表现优异。
SAT与大语言模型结合，能够在真实临床图像上实现有效的分割。

❓

延伸问答

SAT项目的主要目标是什么？

SAT项目旨在利用文本提示实现对497种器官和病灶的3D医学图像通用分割。

SAT与传统医学图像分割模型相比有什么优势？

SAT在分割性能、泛化能力和精准度方面优于传统模型nnU-Nets和交互式模型MedSAM。

SAT项目是如何构建其数据集的？

SAT项目构建了最大规模的3D医学图像分割数据集SAT-DS，汇集了72个公开数据集，包含22K+图像和302K+分割标注。

SAT如何处理长尾类别的分割任务？

SAT在长尾类别的分割任务上表现优异，特别是在尾部类上取得了显著提升。

SAT项目的开源情况如何？

SAT项目的所有数据和代码均已开源，便于研究和应用。

SAT如何与大语言模型结合使用？

SAT可以作为大语言模型的代理工具，通过文本提示实现临床数据的定位和分割能力。

🏷️

继续阅读

Free CPU教程丨西湖大学张岳团队开源科研插图神器AutoFigure，可精准理解长篇科学文本
西湖大学的张岳团队推出了智能科研插图生成系统AutoFigure，旨在解决高质量科研插图的生成难题。该系统基于长篇科学文本，确保插图的逻辑结构准确且视觉美...
从任意视角探索场景：3D体积视频技术突破意味着3D流媒体可能很快成为现实
布朗大学研究人员推出了名为PackUV的3D体积视频处理方法，旨在实现可存储、流式传输的逼真3D视频。该技术通过多台摄像机拍摄场景，并利用算法重建三维空间...
超越解析X12：弥合医疗收入周期工作流程的差距
现代医疗IT面临数据处理与工作流程之间的差距。Genpact和Databricks开发了一个统一的操作工作台，帮助医疗账单员高效处理索赔。该系统在Data...
将您的架构待办事项与技术路线图优先级（TRP）对齐
成功的数字化转型需要业务和技术利益相关者在编写代码前达成共识。70%的转型失败源于利益相关者不一致。使用技术路线图优先级（TRP）框架，组织可以快速确定优...
适用于iPhone和Pixel的最佳Qi2充电宝
本文评测了七款Qi2和Qi2.2无线充电宝，推荐了两款性能优异的产品：Baseus PicoGo AM52以25W无线充电速度表现最佳，能在一小时内为iP...
随着人工智能的进步，它揭示了一个空洞的承诺
文章探讨了AI助手在提高生产力方面的潜力，但指出这种提升并未改善人们的生活。尽管AI能帮助安排日程和处理任务，但无法解决经济系统的问题。作者质疑，随着AI...