小红花·文摘

本文介绍了一种新的弱监督引用图像分割框架，通过利用引用文本提供的信息来定位目标物体。该框架具有三个创新点，包括协调视觉和语言特征之间的域差异、减少噪声背景信息并提高响应图的正确性、生成高质量的伪标签用于训练分割网络。实验证明该框架在性能上优于最新的弱监督方法。