本文提出了一种基于CLIP模型和图像水平监督的对象中心对齐方法,通过伪标注实现高质量对象提议并扩展词汇表,结合两种对象对齐策略,最小化OVD方案中对象和图像中心表示的差距。新方法在COCO数据集上取得了36.6的AP50表现,在LVIS上达到5.0的掩膜AP,总体提高3.4。
本文提出了一种基于CLIP模型和图像水平监督的对象中心对齐方法,通过伪标注实现高质量对象提议并扩展词汇表,将两种对象对齐策略结合,实现了在OVD方案中对象和图像中心表示的最小化差距。该方法在COCO数据集上取得了36.6的AP50表现,在LVIS上,在罕见类别上超越了最新的ViLD模型达5.0的掩膜AP,总体提高3.4。
完成下面两步后,将自动完成登录并继续当前操作。