本文介绍了全景场景图(PSG)生成的新任务,创建了高质量数据集并提出多种改进方法。研究了图像到文本模型(ISRG),显著降低了场景图构建成本。探讨了基于Transformer的DSGG方法,取得了先进的生成效果,并提出了基于结构图的物体检测框架,提升了检测准确性。
完成下面两步后,将自动完成登录并继续当前操作。