本文介绍了一种改进的CLIP模型,通过微调文本编码器和引入大规模语言模型,提升了图像释义的表现。ParaCLIP在释义检索和语义文本相似度任务中表现优异,并在半监督图像标注和细粒度图像重识别应用中显示出显著的性能提升。
完成下面两步后,将自动完成登录并继续当前操作。