本研究提出了一种基于StyleGAN的面部图像姿势和表情迁移方法。该方法利用两个编码器和映射网络,将源图像的姿势和表情无缝转移到目标身份上,且无需人工标注,具有接近实时的性能。
本研究提出了一种名为CL-HOI的跨层人机交互蒸馏框架,旨在减少对人工标注的依赖。通过从视觉大语言模型中提取交互信息,CL-HOI在HICO-DET和V-COCO数据集上表现优于传统方法,验证了其在无标注条件下的有效性。
完成下面两步后,将自动完成登录并继续当前操作。