本文提出了一种新颖的紧凑视频自编码器VidTwin,通过解耦视频的结构和动态潜在向量,解决了视频生成中的压缩与质量平衡问题。实验表明,VidTwin在视频重建中实现了高达0.20%的压缩率,并在生成任务中表现优异,为未来研究奠定了基础。
完成下面两步后,将自动完成登录并继续当前操作。