多模态提示感知器:全能图像恢复的适应性、普适性和保真度
原文中文,约500字,阅读约需2分钟。发表于: 。本研究介绍了 MPerceiver:一种新颖的多模态提示学习方法,利用稳定扩散先验增强了全方位图像修复的适应性、普适性和保真性。通过开发双分支模块,该方法掌握了两种类型的稳定扩散提示:文本提示用于整体表示和视觉提示用于多尺度细节表示。MPerceiver 使用 CLIP...
本研究介绍了MPerceiver,一种多模态提示学习方法,通过稳定扩散先验增强了全方位图像修复的适应性、普适性和保真性。MPerceiver使用文本和视觉提示进行修复,并通过插件细节优化模块提高修复保真性。实验证明,MPerceiver在多任务预训练和低级视觉方面表现出色。在多个实验和基准测试中,MPerceiver展现了适应性、普适性和保真性的优越性。