基于基础模型的少样本全景分割
原文中文,约300字,阅读约需1分钟。发表于: 。借助任务不可知的图像特征,我们提出了 SPINO 方法,该方法可以通过仅使用十个带注释的图像来预测高质量的伪标签,从而实现少样本全景分割,同时为基于基础模型的学习复杂视觉识别任务铺平了道路。
该研究提出了一种基于CNN的新型架构,可以进行端到端的训练,以提供无缝的场景分割结果。该网络结构采用了一种新颖的分割头,将多尺度特征与上下文信息进行了无缝整合,从而预测一致的语义分割和检测结果。研究人员还提出了一种替代panoptic度量的方法,通过在三个具有挑战性的街景数据集上测试,该网络架构取得了最先进的结果。