基于最优传输多边形匹配的多模式基础模型的开放词汇操纵指令的目标分割
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
研究者提出了开放词汇伪装的物体分割任务,并构建了一个大规模复杂场景数据集。通过集成语义知识和视觉结构线索,提出的方法可以有效地捕捉伪装对象,并在数据集上超过了先前的方法。希望这个新任务能推动开放词汇密集预测任务的研究。
🎯
关键要点
- 研究者提出了开放词汇伪装的物体分割任务(OVCOS)。
- 构建了一个包含11,483个精选图像和细粒度注释的大规模复杂场景数据集(OVCamo)。
- 通过集成类别语义知识和视觉结构线索,提出的方法有效捕捉伪装对象。
- 该方法在OVCamo数据集上超过了先前的开放词汇语义图像分割方法。
- 希望这个新任务能推动开放词汇密集预测任务的研究。
➡️