本研究介绍了MPerceiver,一种多模态提示学习方法,通过稳定扩散先验增强了全方位图像修复的适应性、普适性和保真性。MPerceiver使用文本和视觉提示进行修复,并通过插件细节优化模块提高修复保真性。实验证明,MPerceiver在多任务预训练和低级视觉方面表现出色。在多个实验和基准测试中,MPerceiver展现了适应性、普适性和保真性的优越性。
完成下面两步后,将自动完成登录并继续当前操作。