小红花·文摘

本研究评估了三种视觉语言模型（RAD-DINO、CheXagent 和 BiomedCLIP）在胸部X光片气胸和心脏肥大任务中的表现。结果表明，RAD-DINO在分割任务中表现优异，而CheXagent在分类上更具优势。结合全局和局部特征的自定义模型显著提升了所有模型的性能，为选择基础模型提供了实用指导。