一行代码、无需训练突破视频生成时长「魔咒」,清华朱军团队开源全新解决方案RIFLEx

一行代码、无需训练突破视频生成时长「魔咒」,清华朱军团队开源全新解决方案RIFLEx

💡 原文中文,约2600字,阅读约需6分钟。
📝

内容提要

自OpenAI发布Sora以来,视频生成技术迅速进步。生数科技与清华大学联合推出国产视频大模型Vidu,支持16秒视频生成。新方案RIFLEx突破短视频限制,仅需一行代码,已开源,推动视频创作技术的发展。

🎯

关键要点

  • 自OpenAI发布Sora以来,视频生成领域迎来爆发式增长。
  • 生数科技与清华大学联合推出国产视频大模型Vidu,支持一键生成16秒高清视频。
  • Vidu自去年7月上线以来,已服务数千万用户,促进视频内容的智能创作。
  • 腾讯混元、阿里通义万相等开源视频生成模型相继推出,生成5-6秒视频,降低创作门槛。
  • 用户抱怨现有模型受限于生成5-6秒短视频,时长不够用。
  • Vidu团队推出新方案RIFLEx,仅需一行代码突破视频生成长度限制。
  • RIFLEx已开源,支持基于RoPE的各类Video Diffusion Transformer。
  • RIFLEx可实现视频时长外推至10秒,支持多种复杂场景生成。
  • RIFLEx不仅支持时间维度外推,还可扩展至空间维度外推和时空外推。
  • RIFLEx获得广泛关注,知名博主和科技公司称赞其为突破性创新。
  • Vidu团队深入挖掘RoPE的频率成分,提出降低内在频率以避免内容重复。
  • 该方案为视频生成领域提供新的思路,推动长视频生成技术发展。
  • 清华大学TSAIL团队长期致力于扩散模型研究,开发了多个重要模型。

延伸问答

RIFLEx是什么?

RIFLEx是Vidu团队推出的一种新方案,仅需一行代码即可突破视频生成的时长限制,已开源。

RIFLEx如何解决视频生成时长限制的问题?

RIFLEx通过降低内在频率,确保外推后的视频长度在一个周期内,从而避免内容重复。

Vidu模型的特点是什么?

Vidu是国产全自研视频大模型,支持一键生成16秒高清视频,促进了视频内容的智能创作。

RIFLEx支持哪些视频生成场景?

RIFLEx支持时间维度、空间维度和时空外推,能够生成复杂场景和高分辨率视频。

RIFLEx的开源情况如何?

RIFLEx已开源,体现了Vidu团队对开源社区的积极回馈,用户可以在GitHub上获取代码。

RIFLEx的推出对视频生成领域有什么影响?

RIFLEx被认为是视频扩散模型领域的突破性创新,推动了长视频生成技术的发展。

➡️

继续阅读