VGGT-Edit是一种新型3D编辑框架,旨在直接在3D空间中进行编辑,避免传统2D方法的不稳定性。该模型通过残差场预测和深度同步文本注入,实现快速、稳定的3D场景修改,单次编辑约需5秒,速度提升可达120倍。研究团队构建了DeltaScene数据集,以确保多视角下的几何一致性,推动3D编辑技术的发展。
完成下面两步后,将自动完成登录并继续当前操作。