本研究解决了现有文本到视频生成模型在分钟长度视频生成中面临的高计算成本问题,通过提出线性复杂度的LinGen框架,首次实现了在单个GPU上生成高分辨率的分钟级视频,而不牺牲质量。实验结果显示,LinGen在视频质量上优于传统模型,并显著降低了计算延迟,具有广泛的应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。