本研究提出了一种名为MedTrim的方法,通过元实体导向的三元组学习,解决了医疗视觉语言模型在图像与文本对齐中的不足,特别是在细粒度病理属性的区分上。这种方法显著提升了下游检索和分类任务的性能,对医疗影像解读具有重要影响。
完成下面两步后,将自动完成登录并继续当前操作。