Mammo-CLIP：利用对比式语言 - 图像预训练（CLIP）对多视角乳腺摄影增强乳腺癌诊断

通过多视图乳房 X 光片和简单文本的多模态框架 Mammo-CLIP，本研究展示了应用微调视觉语言模型来开发下一代基于图像文本的乳腺癌 CAD 方案的潜力。

eCLIP是CLIP模型的增强版本，通过整合放射科医师眼动热图的专家注释，解决对比性多模式医学图像分析中的关键挑战。它通过整合热图处理器和利用稀缺的专家注释的mixup数据增强，提高模型的学习效果。eCLIP展示了嵌入质量的持续改进，揭示了增强的对齐性和一致性，证实了eCLIP在医学图像领域利用高质量注释进行丰富的多模态分析能力。

CLIP模型 clip eCLIP 医学图像分析多模态分析眼动热图