从 Transformer 中提取出图形用于场景图生成的 EGTR
本文介绍了一种名为DSGG的基于Transformer的新方法,用于场景图检测。该方法通过图感知查询直接预测图,并采用放松子图匹配和关系蒸馏策略来获取紧凑表示和解决关系语义重叠问题。实验结果显示,该模型在场景图生成任务上取得了最先进的结果。
原文中文,约300字,阅读约需1分钟。
本文介绍了一种名为DSGG的基于Transformer的新方法,用于场景图检测。该方法通过图感知查询直接预测图,并采用放松子图匹配和关系蒸馏策略来获取紧凑表示和解决关系语义重叠问题。实验结果显示,该模型在场景图生成任务上取得了最先进的结果。