LinGen:朝着高分辨率分钟级文本到视频生成迈进,具有线性计算复杂度
📝
内容提要
本研究解决了现有文本到视频生成模型在分钟长度视频生成中面临的高计算成本问题,通过提出线性复杂度的LinGen框架,首次实现了在单个GPU上生成高分辨率的分钟级视频,而不牺牲质量。实验结果显示,LinGen在视频质量上优于传统模型,并显著降低了计算延迟,具有广泛的应用潜力。
➡️
本研究解决了现有文本到视频生成模型在分钟长度视频生成中面临的高计算成本问题,通过提出线性复杂度的LinGen框架,首次实现了在单个GPU上生成高分辨率的分钟级视频,而不牺牲质量。实验结果显示,LinGen在视频质量上优于传统模型,并显著降低了计算延迟,具有广泛的应用潜力。