视觉语言模型与无监督领域适应:通过无监督领域适应提升开放词汇分割的可转移性

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种结合视觉语言推理与无监督领域适应的方法,解决了现有分割模型在训练时的类别限制。通过多尺度数据和增强文本嵌入,构建了首个无需共享类别的UDA-FROVSS框架,有效提升了细粒度分割能力。

🎯

关键要点

  • 本研究提出了一种结合视觉语言推理与无监督领域适应的方法。
  • 解决了现有分割模型在训练时受限于定义的类别的问题。
  • 通过多尺度上下文数据和增强的文本嵌入,提高了细粒度分割能力。
  • 构建的UDA-FROVSS框架是首个在不需要共享类别的情况下有效适应不同领域的无监督领域适应方法。
➡️

继续阅读