AIxiv专栏介绍了CE3D,这是一种创新的3D场景编辑方法。通过大规模语言模型解析文本输入,将3D编辑转化为2D图集编辑,实现灵活高效的模型集成。核心技术是Hash-Atlas网络,将3D视图映射到2D空间,支持多视角编辑与3D重建的解耦。CE3D利用ChatGPT进行对话式编辑,支持对象移除和风格迁移等多种任务,突破传统方法限制,具备强大扩展能力。
本文介绍了一种基于对话的3D场景编辑方法CE3D,利用大型语言模型为中心,允许用户通过文本输入解析意图,并调用相应的视觉专家模型。通过设计利用Hash-Atlas表示3D场景视图的方案,将3D场景编辑转移到2D图像上,实现了2D编辑和3D重建过程的解耦。实验结果表明,CE3D能够整合多个视觉模型,实现多样的编辑视觉效果,并具备强大的场景理解能力和多轮对话功能。
完成下面两步后,将自动完成登录并继续当前操作。