指代图像分割的遮罩定位

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本文介绍了一种新的弱监督引用图像分割框架,通过利用引用文本提供的信息来定位目标物体。该框架具有三个创新点,包括协调视觉和语言特征之间的域差异、减少噪声背景信息并提高响应图的正确性、生成高质量的伪标签用于训练分割网络。实验证明该框架在性能上优于最新的弱监督方法。

🎯

关键要点

  • 提出了一种新颖的弱监督引用图像分割 (RIS) 框架。
  • 框架通过正负文本表达的区分来利用引用文本定位目标物体。
  • 具有三个主要创新点:协调视觉和语言特征之间的域差异、减少噪声背景信息、生成高质量的伪标签。
  • 采用双向提示方法协调视觉和语言特征。
  • 通过校准方法提高响应图的正确性。
  • 通过正响应图选择策略生成高质量的伪标签用于训练分割网络。
  • 实验证明该框架在性能上优于最新的弱监督方法。
➡️

继续阅读