实时互动网 ·

ICLR 2026 | 对抗扩散压缩算法在真实世界视频重建任务中的应用

💡 原文中文，约5300字，阅读约需13分钟。

📝

内容提要

本文提出了一种改进的对抗扩散压缩方法（AdcVSR），用于真实世界视频超分辨率。该方法通过剪枝和轻量级一维卷积，显著降低模型参数和推理时间，同时保持视频质量。实验结果表明，AdcVSR在减少95%参数的同时，实现约8倍的速度提升，优化了细节生成与时域一致性。

🎯

提出了一种改进的对抗扩散压缩方法（AdcVSR），用于真实世界视频超分辨率。
AdcVSR通过剪枝和轻量级一维卷积显著降低模型参数和推理时间，同时保持视频质量。
实验结果显示，AdcVSR在减少95%参数的同时，实现约8倍的速度提升。
现有扩散模型在真实世界视频超分辨率任务中推理速度较慢，单步生成网络有所改善，但仍存在参数庞大和推理延迟的问题。
对抗扩散压缩（ADC）方法通过剪枝与蒸馏将模型压缩为轻量的AdcSR网络，但在细节生成与时域一致性之间难以平衡。
AdcVSR结合了3D时空注意力的扩散Transformer教师模型DOVE，经过剪枝得到2D Stable Diffusion结构，并引入轻量级1D时域卷积。
提出双头对抗蒸馏策略，在像素域和特征域分别引入判别器，以优化细节质量与时间一致性。
AdcVSR在保持视频质量的同时，显著提升了推理效率，达到了良好的保真度、细节丰富度、时域一致性与计算效率的平衡。

🔎

AdcVSR通过对抗扩散压缩方法显著降低了模型的参数量和推理时间，达到95%的参数压缩和8倍的速度提升。这使得在实际应用中，视频超分辨率的处理更加高效，适合实时场景，尤其是在资源受限的设备上。

在视频超分辨率任务中，细节生成与时域一致性常常存在优化冲突。AdcVSR通过双头对抗蒸馏策略，分别在像素域和特征域进行优化，有效解决了这一问题。这种方法的成功应用为未来的模型设计提供了新的思路。

AdcVSR采用了2D+1D的网络结构，利用剪枝后的2D Stable Diffusion骨架与轻量级1D时域卷积相结合。这种设计不仅提升了生成能力，还降低了计算复杂度，展示了在视频超分辨率领域的创新潜力。

❓

AdcVSR通过剪枝和轻量级一维卷积显著降低模型参数和推理时间，同时保持视频质量，提出双头对抗蒸馏策略优化细节质量与时域一致性。

AdcVSR在保持视频质量的同时，减少了95%的参数量，并实现约8倍的推理速度提升。

ADC方法通过剪枝与蒸馏将大型模型压缩为轻量的AdcSR网络，旨在提高视频超分辨率的效率和质量。

AdcVSR通过双头对抗蒸馏策略，在像素域和特征域分别引入判别器，实现细节质量与时域一致性的解耦优化。

AdcVSR采用2D+1D的网络结构，利用剪枝后的2D Stable Diffusion骨架生成细节，并通过轻量级1D时域卷积建模帧间一致性。

实验使用了全参考指标PSNR、SSIM、LPIPS、DISTS，以及无参考指标MANIQA、CLIPIQA、MUSIQ作为评估指标。

🏷️