BIVDiff:基于图像和视频扩散模型的无需训练的通用视频合成框架
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
DiffBIR是一个解决盲目图像恢复问题的框架,通过预训练的文本到图像扩散模型实现。它采用两阶段流程,第一阶段通过预训练恢复模块提高泛化能力,第二阶段利用潜在扩散模型生成逼真的图像恢复。DiffBIR在盲目图像超分辨率和盲目人脸恢复任务上优于现有方法。
🎯
关键要点
- DiffBIR是一个解决盲目图像恢复问题的框架。
- DiffBIR利用预训练的文本到图像扩散模型。
- 框架采用两阶段流程,第一阶段提高泛化能力,第二阶段生成逼真的图像恢复。
- 引入可控模块,通过潜在图像指导平衡质量和保真度。
- 在盲目图像超分辨率和盲目人脸恢复任务上优于现有方法。
- 代码可在指定的URL找到。
➡️