广义无偏场景图生成
💡
原文中文,约500字,阅读约需1分钟。
📝
内容提要
现有的无偏场景图生成方法只关注谓词级不平衡,忽视了概念级别的不平衡。我们提出了广义无偏场景图生成(G-USGG)问题,考虑了谓词级和概念级的不平衡。通过多概念学习(MCL)框架和概念正则化(CR)技术,我们量化了谓词之间的概念级不平衡,并有效地学习概念原型。引入平衡原型记忆(BPM)实现对不同概念的平衡学习。实验证明我们的模型在提高 VG-SGG 和 OI-SGG 数据集上基准模型性能方面有效,取得了谓词级无偏关系识别和概念级组合生成两个关键方面的最新成就。
🎯
关键要点
- 现有的无偏场景图生成方法只关注谓词级不平衡,忽视了概念级别的不平衡。
- 提出了广义无偏场景图生成(G-USGG)问题,考虑了谓词级和概念级的不平衡。
- 引入多概念学习(MCL)框架,通过多个概念原型量化谓词之间的概念级不平衡。
- 使用概念正则化(CR)技术有效学习概念原型。
- 引入平衡原型记忆(BPM)实现对不同概念的平衡学习。
- 实验证明模型在提高 VG-SGG 和 OI-SGG 数据集上基准模型性能方面有效。
- 取得了谓词级无偏关系识别和概念级组合生成两个关键方面的最新成就。
➡️