小红花·文摘

本研究提出了一种扩展的图像扩散模型，用于高保真度视频生成，结合文本条件生成和视频预测。通过轻量级模型和新策略，优化视频质量，显著优于传统生成对抗网络。研究回顾了视频扩散模型在生成、编辑和理解任务中的应用，并探讨了未来发展趋势。