小红花·文摘

本文介绍了一种名为4Diffusion的新型4D生成管道，旨在从单目视频中生成空间时间一致的4D内容。通过将可学习的运动模块与冻结的3D感知扩散模型结合，设计了一个统一扩散模型，以捕捉多视图空间时间相关性。实验证明，该方法性能更好。