BriefGPT - AI 论文速递 ·

无限：为城市街景生成照片级真实合成数据以用于物体检测

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

本文介绍了一种利用数据合成技术生成大规模注释数据集的方法，以提升物体检测模型的性能和泛化能力。研究探讨了合成数据在深层神经网络训练中的应用，展示了新数据集UrbanSyn的优势，并提出了一种动态城市街景生成方法，能够根据用户需求生成高质量的城市视图。

🎯

❓

UrbanSyn数据集具有高质量的几何和材料开发，提供像素级别的地面真实性，包括深度、语义分割和实例分割。

通过数据合成技术生成大规模注释数据集，可以避免因缺乏原始数据而导致检测模型性能下降，从而提高模型的性能和泛化能力。

领域随机化技术用于提高模型在不同环境下的泛化能力，确保模型在合成数据上训练时能够适应真实世界的变化。

研究提出了一种新的显式场景表示方法，使用带有语义标签和3D高斯模型的点云来表示动态城市街景，实现场景的编辑和生成。

UrbanSyn与GTAV和Synscapes数据集互补，形成了“三剑客”，在图像语义分割的无监督域适应中表现出色，建立了新的基准。

通过动态合成大规模场景的方法，结合用户输入的城市名称、天气和基础地图/布局，可以生成高质量的城市视图。

🏷️