开放词汇分割的可转移和原则性效率
原文中文,约500字,阅读约需2分钟。发表于: 。通过利用较小、训练成本更低的模型,本论文的核心策略旨在实现与基于大型视觉语言基础模型的先前开放词汇分割工作相媲美甚至更好的性能,以解决开放词汇分割(OVS)方法面临的高计算开销问题,并在各种 OVS 基准测试中展示了我们在分割准确性和计算成本之间卓越的平衡。
计算机视觉中的目标检测和分割在深度学习时代取得了巨大进展,但现有数据集中的标注类别较小且预定义,无法推广到开放词汇之外。近年来,越来越多的关注集中在开放词汇检测和分割上。本调研提供了对过去和最新开放词汇检测和分割发展的全面审查,包括不同方法学的分类和讨论,并提供了一些有前途的方向,以激发未来的研究。