本文介绍了一种新的全景场景图生成(PVSG)任务,创建了高质量数据集以进行基准测试,并探讨了传统方法与基于Transformer的改进。PVSG要求更精确的像素级分割,以提升场景理解。研究展示了在4D全景分割和视频问答等任务中的优异性能。
该研究提出了全景场景图生成(PVSG)问题,旨在通过建立真实世界视觉感知系统来促进整体场景理解。PVSG要求使用像素级分割掩码实体识别来提高场景图的准确性。研究者还提供了PVSG数据集和基准方法。
完成下面两步后,将自动完成登录并继续当前操作。