本研究提出了一种新的上下文感知弱监督学习方法,通过深度网络细化物体并建模实体关系,实现更准确的物体表述和匹配。实验证明该方法在Flickr30K和ReferItGame数据集上具有更好的性能。
本研究提出了一种新的上下文感知弱监督学习方法,通过两阶段深度网络结合精细化物体和实体关系建模,提高物体表述和匹配准确性。实验结果显示,该方法在Flickr30K和ReferItGame数据集上的准确度分别达到59.27%和37.68%。
完成下面两步后,将自动完成登录并继续当前操作。