MedTrinity-25M: 医学多模式多粒度标注的大规模数据集
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
介绍了MedTrinity-25M数据集,包含2500万张多模态医学图像,支持多种任务。通过在该数据集上预训练,模型在VQA-RAD和PathVQA上取得最先进性能。该数据集可用于支持大规模多模态医学AI模型的预训练,为医学领域基础模型的发展做出贡献。
🎯
关键要点
- MedTrinity-25M 数据集是一个综合的大规模多模态医学数据集,包含超过 2500 万张图像。
- 该数据集涵盖 10 种模式,并对 65 种疾病进行了多重粒度的注释。
- 支持多种多模态任务,包括字幕生成、报告生成、分类和分割。
- 在 MedTrinity-25M 上进行预训练的模型在 VQA-RAD 和 PathVQA 上实现了最先进的性能。
- 该数据集有助于支持大规模多模态医学 AI 模型的预训练,推动医学领域基础模型的发展。
➡️