通过服装聚焦的扩散模型改善虚拟试穿
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了一种新颖的面向虚拟试衣的模型FLDM-VTON,通过改进潜在扩散过程和提供衣物先验和衣物忠实监督,提高了模型性能。实验证明FLDM-VTON能够生成具有忠实衣物细节的照片级别的试衣图像。
🎯
关键要点
- 虚拟试衣(VTON)基于潜在扩散模型的生成性能令人印象深刻,但缺乏对衣物关键细节的忠实性。
- 提出了一种新颖的面向VTON的忠实潜在扩散模型FLDM-VTON。
- FLDM-VTON在三个主要方面改进了传统的潜在扩散过程。
- 将变形的衣物作为起点和局部条件,为模型提供忠实的衣物先验。
- 引入新颖的衣物扁平化网络,以约束生成的试衣图像,提供一致的衣物忠实监督。
- 设计具有忠实推理的衣物后验采样,进一步提高模型性能。
- FLDM-VTON在基准VITON-HD和Dress Code数据集上表现优于最先进的基线方法,生成照片级别的试衣图像。
➡️