增强数据传输与人工三元组合作的场景图生成
原文中文,约200字,阅读约需1分钟。发表于: 。本文重点在于场景图生成(SGG)的训练数据集增强,通过引入 Feature Space Triplet Augmentation(FSTA)和 Soft Transfer 两个模块,成功提高了对具有挑战性的关系三元组的预测准确性,并在 Visual Genome 数据集中取得了较高的召回率。
介绍了IETrans内外数据传输方法,解决场景图生成中的长尾分布和语义歧义问题。通过创建增强数据集,提供更充分和连贯的注释,可应用于大规模带有1,807个谓词类的SGG。使用神经因子模型在增强数据集上训练,保持竞争性宏性能的同时,使得宏性能翻倍。