小红花·文摘 - 小红花技术领袖俱乐部

Sora 的工作原理（及其意义） [译]

Sora 的工作原理（及其意义） [译]

宝玉的分享 ·

该文介绍了一种基于Transformer的文本到视频模型，使用U-Net从噪音版本重构图像，并使用GPT2在UCF101数据集上进行测试，展示其能够生成有希望的视频。

通过 Transformer 实现的简单文本到视频模型

BriefGPT - AI 论文速递 ·

该文介绍了一个新的、具有挑战性的多任务基准——StoryBench，用于评估文本到视频模型。该基准包括三个逐渐增加难度的视频生成任务，并为人工评估视频故事建立了指南。强调了对于视频生成而言更好的自动度量指标的需求，该基准旨在鼓励未来在这个令人兴奋的新领域中的研究。

位流损坏的视频恢复：一个新的基准数据集和方法

BriefGPT - AI 论文速递 ·

构建AI网络电视

Hugging Face - Blog ·