本文提出了一种新型场景图生成算法,结合外部知识和图像重建损失,提升场景图的可推广性,并解决嘈杂对象注释偏差问题。实验结果表明,该框架在“视觉关系检测”和“视觉基因组”数据集上表现优异。
完成下面两步后,将自动完成登录并继续当前操作。