本文介绍了一种名为4Diffusion的新型4D生成管道,旨在从单目视频中生成空间时间一致的4D内容。通过将可学习的运动模块与冻结的3D感知扩散模型结合,设计了一个统一扩散模型,以捕捉多视图空间时间相关性。实验证明,该方法性能更好。
完成下面两步后,将自动完成登录并继续当前操作。