小红花·文摘

本研究提出了MuseFace框架，解决了文本驱动面部编辑在多样性和可控性方面的不足。通过生成语义掩码，结合扩散模型和语义编辑模型，显著提高了编辑的精度和控制能力，实验结果表明其具有高保真性和广泛的应用潜力。

MuseFace: A Text-Driven Approach to Facial Editing Using Diffusion-Generated Masks

BriefGPT - AI 论文速递 ·

新型AI系统实现精确面部编辑，确保身份一致性

DEV Community ·

本文介绍了InterFaceGAN框架，旨在解析生成对抗网络（GAN）在面部编辑中的语义。研究表明，GAN的潜在空间可以实现精确的面部特征控制，并生成高保真图像。通过优化潜在空间和引入新编辑方法，提升了图像生成的质量和可控性，实验结果显示该方法能够有效编辑多种属性，同时保持图像的真实感。

朝着潜在空间的动力学操控

BriefGPT - AI 论文速递 ·

本文介绍了一种基于预训练StyleGAN的框架，能够生成高分辨率视频和音频驱动的面部编辑。该方法通过音频特征生成口型同步的高质量面部视频，并提出了多种技术以提高视觉质量和同步准确性，包括无声唇部生成器和自适应损失函数。新方法OpFlowTalker利用光流增强图像连续性，而RealTalk框架则实现高效的唇语同步和面部图像生成，适用于实际应用。

SegTalker：基于分割的带面部表情生成的口语生成方法

BriefGPT - AI 论文速递 ·

本文介绍了一种基于预训练StyleGAN的框架，能够生成高分辨率视频，实现音频驱动的面部动画和灵活的面部编辑。该方法通过视频和音频生成模块优化合成效果，表现优于现有技术，生成自然的对话人脸视频，并在面部表情和头部姿态控制方面具有较高的质量和灵活性。

通过 StyleGAN 实现基于音频的高分辨率无缝对口视频编辑

BriefGPT - AI 论文速递 ·

本文提出了 StyLandGAN 框架，利用深度图像合成生成多样的深度地图，表现优于现有模型。同时，研究探讨了基于 StyleGAN 的视频合成和面部编辑技术，展示了高质量生成和灵活控制的优势。

StyleCineGAN：使用预训练的 StyleGAN 生成景观动态照片

BriefGPT - AI 论文速递 ·

VIVE3D方法通过新的GAN反演技术和光流引导合成技术，扩展了基于图像的三维生成对抗网络的能力，实现了高质量的面部编辑和与原始视频的合成。

即时注视：基于广角单目视频录制的虚拟摄像机在线拍摄选择和编辑

BriefGPT - AI 论文速递 ·

SDFlow是一种新型框架，通过使用连续条件归一化流实现语义分解，解决了面部编辑中的复杂导航问题，并提供了精确的操作控制。实验证明，SDFlow在定性和定量两方面均优于现有最先进的面部编辑方法。

面部编辑的语义潜变分与标准流

BriefGPT - AI 论文速递 ·

通过VIVE3D方法，我们扩展了基于图像的三维生成对抗网络的能力，使其能够在保持身份和时间一致的同时呈现输入视频。我们提出了两个新的构建块，包括针对三维生成对抗网络的新颖GAN反演技术和借助3D GANs的固有属性和光流引导合成技术显示头部的新视图的编辑。实验结果表明，VIVE3D能够以一致的质量生成高保真度的面部编辑，并与原始视频以时间和空间一致的方式合成。

RIGID: 实时人脸视频的循环生成对抗网络还原和编辑

BriefGPT - AI 论文速递 ·