港科大团队开源的VideoVAE+是一种跨模态视频变分自编码器,采用时空分离压缩机制和文本指导,能够高效压缩和重建大幅运动视频,有效解决时序闪烁和细节模糊问题。该模型在多个数据集上表现优异,超越了多种现有技术。
完成下面两步后,将自动完成登录并继续当前操作。