该文章介绍了一种名为GroundVLP的零样本方法,通过结合热力图和开放词汇检测器的对象提案,解决了视觉定位任务中数据标注不足的问题。实验结果显示该方法在RefCOCO/+/g数据集上超过了现有零样本方法的28%,在Flickr30k实体数据集上表现相当甚至更好。
完成下面两步后,将自动完成登录并继续当前操作。