通过服装聚焦的扩散模型改善虚拟试穿

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了一种新颖的面向虚拟试衣的模型FLDM-VTON,通过改进潜在扩散过程和提供衣物先验和衣物忠实监督,提高了模型性能。实验证明FLDM-VTON能够生成具有忠实衣物细节的照片级别的试衣图像。

🎯

关键要点

  • 虚拟试衣(VTON)基于潜在扩散模型的生成性能令人印象深刻,但缺乏对衣物关键细节的忠实性。
  • 提出了一种新颖的面向VTON的忠实潜在扩散模型FLDM-VTON。
  • FLDM-VTON在三个主要方面改进了传统的潜在扩散过程。
  • 将变形的衣物作为起点和局部条件,为模型提供忠实的衣物先验。
  • 引入新颖的衣物扁平化网络,以约束生成的试衣图像,提供一致的衣物忠实监督。
  • 设计具有忠实推理的衣物后验采样,进一步提高模型性能。
  • FLDM-VTON在基准VITON-HD和Dress Code数据集上表现优于最先进的基线方法,生成照片级别的试衣图像。
➡️

继续阅读