本研究评估了三种视觉语言模型(RAD-DINO、CheXagent 和 BiomedCLIP)在胸部X光片气胸和心脏肥大任务中的表现。结果表明,RAD-DINO在分割任务中表现优异,而CheXagent在分类上更具优势。结合全局和局部特征的自定义模型显著提升了所有模型的性能,为选择基础模型提供了实用指导。
完成下面两步后,将自动完成登录并继续当前操作。