BriefGPT - AI 论文速递 ·

AUG：一种用于航空图像城市场景图生成的新数据集和高效模型

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

本文介绍了全景场景图（PSG）生成的新任务，创建了高质量数据集并提出多种改进方法。研究了图像到文本模型（ISRG），显著降低了场景图构建成本。探讨了基于Transformer的DSGG方法，取得了先进的生成效果，并提出了基于结构图的物体检测框架，提升了检测准确性。

🎯

❓

全景场景图生成任务是基于全景分割生成全景场景图的一种新任务。

ISRG模型通过将场景图任务分解为图像分割和自回归文本生成两个子任务，显著降低了场景图构建成本。

DSGG方法将场景图检测视为直接图预测问题，采用放松子图匹配获取图节点及其关系的紧凑表示，取得了先进的生成效果。

该框架基于结构图，使用图神经网络和语义空间相似性来考虑物体之间的关系，显著提高了不确定物体检测的准确性。

通过引入综合连续场景图生成数据集和多个评估指标来基准测试全景场景图生成的效果。

高质量PSG数据集用于基准测试，帮助评估和改进全景场景图生成的方法。

🏷️