ReCon1M: 一个大规模用于远程感知图像关系理解的基准数据集
原文中文,约300字,阅读约需1分钟。发表于: 。在本研究中,我们介绍了第一个公开可用的大规模、百万级别关系数据集,名为 ReCon1M,用于遥感图像领域。该数据集建立在 Fair1M 的基础上,包括 21,392 张图像,859,751 个不同类别的目标边界框的注释,以及基于这些边界框的 1,149,342 个关系三元组注释。我们对该数据集进行了两个目标检测任务和三个 SGG 子任务的评估,对主流方法在这些任务上的性能进行了分析。
RepSGG是一种新型架构,用于生成场景图。它使用查询和键来表示实体和目标,并通过最大注意力权重表示它们之间的关系。通过仿射变换,RepSGG鼓励平衡性能。实验结果显示,RepSGG在Visual Genome和Open Images V6数据集上具有先进的性能和快速推理速度。