现有方法忽视了场景图生成中的概念不平衡问题。为此,提出了广义无偏场景图生成(G-USGG),结合多概念学习和概念正则化技术,量化并学习谓词间的不平衡。通过平衡原型记忆实现概念的平衡学习。实验表明,该方法在VG-SGG和OI-SGG数据集上显著提升了模型性能。
现有的无偏场景图生成方法只关注谓词级不平衡,忽视了概念级别的不平衡。我们提出了广义无偏场景图生成(G-USGG)问题,考虑了谓词级和概念级的不平衡。通过多概念学习(MCL)框架和概念正则化(CR)技术,我们量化了谓词之间的概念级不平衡,并有效地学习概念原型。引入平衡原型记忆(BPM)实现对不同概念的平衡学习。实验证明我们的模型在提高 VG-SGG 和 OI-SGG 数据集上基准模型性能方面有效,取得了谓词级无偏关系识别和概念级组合生成两个关键方面的最新成就。
完成下面两步后,将自动完成登录并继续当前操作。