机器之心 ·

合成数据助力视频生成提速8.5倍，上海AI Lab开源AccVideo

💡 原文中文，约3500字，阅读约需9分钟。

📝

内容提要

上海AI Lab提出的AccVideo方法通过合成数据集加速视频扩散模型，生成速度提升8.5倍，显著提高训练效率。该方法避免无效数据点，采用轨迹指导和对抗训练策略，能在较少推理步骤下生成高质量视频。

🎯

🔎

AccVideo通过构建合成视频数据集SynVid，显著提升了训练效率。这种方法不仅减少了对真实数据的需求，还避免了无效数据点的使用，从而提高了模型的蒸馏效率。合成数据集的有效性在于它能够提供高质量的去噪轨迹，确保学生模型获得准确的指导。

AccVideo采用对抗训练策略，以最小化对抗散度，提升学生模型的性能。这种方法避免了传统蒸馏方法中常见的前向扩散操作，从而减少了对无效数据的依赖，确保了生成视频的质量和稳定性。这一创新为视频生成领域提供了新的思路。

AccVideo在生成速度上实现了8.5倍的提升，这对于需要快速生成高质量视频的应用场景尤为重要。相比于传统模型，AccVideo的高效性使其在实际应用中更具竞争力，尤其是在资源有限的情况下，能够更好地满足用户需求。

❓

AccVideo方法通过合成数据集加速视频扩散模型，生成速度提升8.5倍，并显著提高训练效率。

AccVideo采用基于轨迹的少步指导机制，使学生模型能够以更少的推理步数生成视频，减少了推理步骤数量。

SynVid用于构建合成视频数据集，避免无效数据点，提高蒸馏效率，支持AccVideo的训练过程。

实验结果显示，AccVideo生成的视频伪影更少，画面保真度更高，效果优于HunyuanVideo等模型。

AccVideo仅需8块A100显卡和3.84万条合成数据，训练12天即可生成高质量视频。

对抗训练策略最小化对抗散度，确保教师模型为学生模型提供准确指导，提升学生模型性能。

🏷️