RAVEN:以高效的三层平面网络重新思考对抗性视频生成
原文中文,约500字,阅读约需2分钟。发表于: 。我们提出了一种新颖的无条件视频生成模型,旨在解决长期的空间和时间依赖关系。通过使用混合的显式隐式三平面表示法和单一潜变量模型整个视频序列,我们的方法捕捉这些依赖关系。通过从主要潜变量推导出的中间三平面表示,合成单个视频帧。这种新颖策略通过 FLOPs 测量将计算复杂性降低了 2...
该文章介绍了一种新的视频生成模型,使用混合的显式隐式三平面表示法和单一潜变量模型来捕捉依赖关系,并通过合成单个视频帧来生成整个视频序列。该方法计算复杂性降低了2倍,减少了视觉伪影的生成。通过集成基于光流的模块,进一步增强了模型的能力,能够合成高保真的视频片段。在三个不同数据集上验证了该方法的有效性和多功能性。