小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种扩展的图像扩散模型，能够联合训练图像和视频数据，生成高保真度的时空视频。通过改进的有条件采样技术，该模型在文本条件视频生成和视频预测方面取得了先进成果，并展示了高分辨率视频生成和动态三维物体的视频生成的有效性和优越性。

HARIVO：利用文本到图像模型生成视频

BriefGPT - AI 论文速递 ·

本研究提出了一种基于去噪扩散概率模型的视频建模框架，能够生成长达25分钟的高质量视频。通过引入多种文本条件，扩展了文本驱动视频生成的能力，并提出了新的自我关注计算方式和语义运动预测模块，显著提升了视频生成效果。此外，研究探讨了低质量视频训练高质量模型的可行性，取得了显著成果。

FreeLong: 无需训练的长视频生成与 SpectralBlend 时域注意力

BriefGPT - AI 论文速递 ·

Sora技术报告视频生成模型作为世界模拟器笔记

Sora技术报告视频生成模型作为世界模拟器笔记

plus studio ·

视频生成模型：构建虚拟世界的模拟器 [译]

视频生成模型：构建虚拟世界的模拟器 [译]

宝玉的分享 ·

视频生成模型作为世界模拟器

视频生成模型作为世界模拟器

OpenAI ·