小红花·文摘

阿里巴巴通义千问团队推出了全能图像编辑模型Qwen-Image-Edit，具备语义与外观双重编辑能力，支持中英文文字精准编辑，显著提升图像编辑效果。

图像编辑新SOTA！Qwen-Image-Edit兼具语义与外观双重编辑能力；25种欧洲语言！Granary破题多语种模型数据荒

HyperAI超神经 ·

本研究提出了MuseFace框架，解决了文本驱动面部编辑在多样性和可控性方面的不足。通过生成语义掩码，结合扩散模型和语义编辑模型，显著提高了编辑的精度和控制能力，实验结果表明其具有高保真性和广泛的应用潜力。

MuseFace: A Text-Driven Approach to Facial Editing Using Diffusion-Generated Masks

BriefGPT - AI 论文速递 ·

本文介绍了多种基于StyleGAN的图像生成和编辑方法，包括人脸图像的语义编辑、3D可控操作及多模式输出。这些方法在生成质量和真实感上具有显著优势，并提出了新的框架和数据集，推动了图像处理技术的发展。

MM2Latent：基于多模态辅助的文本到面部图像生成与编辑

BriefGPT - AI 论文速递 ·

本文讨论了在人工智能领域中对更易理解和可解释的基础模型和嵌入的需求。作者探索了一种可扩展和自动化的方法，通过在小型语言模型中探测嵌入向量，并映射出模型潜在空间中表示的可解释属性的特定方向。文章还讨论了将稀疏自编码器应用于文本嵌入以及使用潜在空间中的干预进行精确语义编辑的能力。作者分享了语义编辑的示例，并讨论了未来更丰富的界面和应用的潜力。

棱镜：在语言潜在空间中映射可解释的概念和特征

thesephist ·

通过Steered Diffusion框架实现了逼真零样本条件图像生成，修补、着色、语义编辑和超分辨率方面有明显改进，计算成本较低。

具备预训练生成模型的条件图像生成

BriefGPT - AI 论文速递 ·

利用Steered Diffusion框架实现逼真零样本条件图像生成，修补、着色、语义编辑和图像超分辨率方面有明显改进，计算成本较低。

通过辛共轭方法实现准确的导向扩散采样

BriefGPT - AI 论文速递 ·

通过Steered Diffusion框架实现了逼真零样本条件图像生成，修补、着色、语义编辑和图像超分辨率方面有明显改进，计算成本较低。

零样本引导图像合成的分层渲染扩散模型

BriefGPT - AI 论文速递 ·

利用Steered Diffusion框架实现逼真零样本条件图像生成，改进了修补、着色、语义编辑和图像超分辨率，计算成本低。

流形保持引导扩散

BriefGPT - AI 论文速递 ·

该文介绍了一种基于Steered Diffusion框架的逼真零样本条件图像生成方法，通过使用预先训练的逆模型设计的损失，利用扩散模型的生成控制能力，在推理时引导扩散模型的图像生成过程。实验表明，该框架在修补、着色、文本引导的语义编辑和图像超分辨率等任务上有明显的定性和定量改进，同时增加了可忽略的额外计算成本。

通过自动检测不可行计划，改进扩散规划器以实现可靠行为综合

BriefGPT - AI 论文速递 ·

该研究使用生成模型找到脸部图像中感知属性的语义编辑，以改变脸部图像中的任何输入脸沿属性轴的转换。通过预测模型和人类评分，在真实和合成脸上进行培训和评估，证明了该方法的普适性，最终可用于理解和解释对面部主观解释中的偏见。

基于人类第一印象的主观面部转换

BriefGPT - AI 论文速递 ·