香港大学和阿里联合提出了一种基于扩散的生成器AnyDoor,用于对象隐形传态。该研究使用判别ID提取器和频率感知细节提取器来表征目标对象。AnyDoor为区域到区域的映射任务提供了通用解决方案,并可应用于各种应用。该研究还介绍了背景移除和自监督表示的方法,以及特征注入和训练策略。通过使用视频数据集和自适应训练步长,该方法能够更好地学习外观变化和精细细节。
AnyDoor是一种基于扩散的生成器,能够实现对象的隐形传态。它通过判别ID提取器和频率感知细节提取器,在视频和图像数据上进行训练,合成目标对象。研究中采用背景移除和自监督表示,提升生成效果,并通过高频映射保持细节。模型结合ID标记和细节图,使用稳定扩散进行生成,并优化训练策略以适应视频和图像数据。
完成下面两步后,将自动完成登录并继续当前操作。