小红花·文摘

本研究改进了CLIP模型，提升了其对细粒度和句法的理解能力，开发了UMG-CLIP框架，超越了现有图像理解基准。提出的CLIP-DIY方法在零样本语义分割中表现优异，DetCLIP通过概念词典提高了零样本检测性能。此外，研究探讨了CLIP在物体再识别中的应用，并提出了有效的微调方法。