BIVDiff:基于图像和视频扩散模型的无需训练的通用视频合成框架

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

DiffBIR是一个解决盲目图像恢复问题的框架,通过预训练的文本到图像扩散模型实现。它采用两阶段流程,第一阶段通过预训练恢复模块提高泛化能力,第二阶段利用潜在扩散模型生成逼真的图像恢复。DiffBIR在盲目图像超分辨率和盲目人脸恢复任务上优于现有方法。

🎯

关键要点

  • DiffBIR是一个解决盲目图像恢复问题的框架。
  • DiffBIR利用预训练的文本到图像扩散模型。
  • 框架采用两阶段流程,第一阶段提高泛化能力,第二阶段生成逼真的图像恢复。
  • 引入可控模块,通过潜在图像指导平衡质量和保真度。
  • 在盲目图像超分辨率和盲目人脸恢复任务上优于现有方法。
  • 代码可在指定的URL找到。
➡️

继续阅读