AUG:一种用于航空图像城市场景图生成的新数据集和高效模型

💡 原文中文,约1400字,阅读约需4分钟。
📝

内容提要

本文介绍了全景场景图(PSG)生成的新任务,创建了高质量数据集并提出多种改进方法。研究了图像到文本模型(ISRG),显著降低了场景图构建成本。探讨了基于Transformer的DSGG方法,取得了先进的生成效果,并提出了基于结构图的物体检测框架,提升了检测准确性。

🎯

关键要点

  • 介绍了一项新的任务,即基于全景分割生成全景场景图(PSG)。
  • 创建了一个高质量的 PSG 数据集用于基准测试,并介绍了四种传统方法的改进和两种基于 Transformer 的单阶段基线。
  • 提出了一种基于图像语义关系生成的图像到文本模型(ISRG),显著降低了场景图构建成本。
  • 基于 Transformer 的 DSGG 方法将场景图检测视为直接图预测问题,取得了先进的生成效果。
  • 提出了一种基于结构图的物体检测框架,显著提高了不确定物体检测的准确性。

延伸问答

什么是全景场景图(PSG)生成任务?

全景场景图生成任务是基于全景分割生成全景场景图的一种新任务。

文章中提到的ISRG模型有什么优势?

ISRG模型通过将场景图任务分解为图像分割和自回归文本生成两个子任务,显著降低了场景图构建成本。

DSGG方法是如何改进场景图生成的?

DSGG方法将场景图检测视为直接图预测问题,采用放松子图匹配获取图节点及其关系的紧凑表示,取得了先进的生成效果。

文章中提到的物体检测框架有什么创新之处?

该框架基于结构图,使用图神经网络和语义空间相似性来考虑物体之间的关系,显著提高了不确定物体检测的准确性。

如何评估全景场景图生成的效果?

通过引入综合连续场景图生成数据集和多个评估指标来基准测试全景场景图生成的效果。

文章中提到的高质量PSG数据集有什么用途?

高质量PSG数据集用于基准测试,帮助评估和改进全景场景图生成的方法。

➡️

继续阅读