开放词汇RGB-T零样本语义分割在开放世界环境中的应用
💡
原文中文,约500字,阅读约需1分钟。
📝
内容提要
深度学习推动了计算机视觉中的目标检测和分割,但由于标注成本高,数据集类别有限,难以扩展到开放词汇。近年来,开放词汇检测和分割受到关注。本文综述了这些领域的发展,提出了分类法,涵盖视觉-语义映射和视觉特征合成等方法,讨论了每种方法的原则、挑战和优缺点,并进行了基准测试,最后提出未来研究方向。
🎯
关键要点
- 深度学习推动了计算机视觉中的目标检测和分割的进展。
- 由于手动标注成本高,现有数据集的标注类别有限,难以推广到开放词汇。
- 开放词汇检测(OVD)和分割(OVS)近年来受到越来越多的关注。
- 本文提供了对OVD和OVS发展的全面审查,并提出了分类法。
- 分类法涵盖了视觉-语义空间映射、新颖的视觉特征合成等方法。
- 不同方法的弱监督信号的许可和使用可以很好地区分。
- 分类法适用于目标检测、语义/实例/全景分割、三维场景和视频理解等任务。
- 详细讨论了每种方法的原则、挑战、优缺点及发展路线。
- 对每个方法的关键组成部分进行了基准测试。
- 提出了一些有前途的研究方向以激发未来的研究。
➡️