本研究提出了一种扩展的图像扩散模型,用于高保真度视频生成,结合文本条件生成和视频预测。通过轻量级模型和新策略,优化视频质量,显著优于传统生成对抗网络。研究回顾了视频扩散模型在生成、编辑和理解任务中的应用,并探讨了未来发展趋势。
完成下面两步后,将自动完成登录并继续当前操作。