本文介绍了视频生成模型Sora的结构和训练过程,包括采用的TECO模型、Diffusion Model和Spacetime Latent Patch等。Sora基于Transformer网络,旨在生成高质量、长时一致性的视频。训练过程包括两阶段,支持多种方式的视频生成。文章还讨论了Sora作为物理世界模拟器的可能性。
SSDNeRF是一种新方法,使用Diffusion Model学习神经辐射场的可推广先验,实现3D重建和先验学习,具有鲁棒性结果。
完成下面两步后,将自动完成登录并继续当前操作。