细粒度场景图生成的自适应自训练框架
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本研究介绍了一种自我训练框架(ST-SGG),通过利用未标注的三元组来缓解场景图生成模型在长尾问题上的困扰。同时提出了一种新型伪标记技术(CATM)和图结构学习器(GSL),对现有场景图生成模型具有益处。实验证明ST-SGG在各种场景图生成模型中有效,特别是在细粒度谓词类的性能提升方面。
🎯
关键要点
- 本研究介绍了一种自我训练框架(ST-SGG),旨在缓解场景图生成模型的长尾问题。
- 提出了一种新型伪标记技术,称为Class-specific Adaptive Thresholding with Momentum(CATM),适用于现有场景图生成模型。
- 设计了一个图结构学习器(GSL),对基于消息传递神经网络(MPNN)的场景图生成模型有益。
- 实验结果表明,ST-SGG在多种场景图生成模型中有效,尤其在细粒度谓词类的性能提升方面。
➡️