小红花·文摘 - 小红花技术领袖俱乐部

腾讯优图与多所研究机构联合推出DynamicControl框架，提升文本生成图像的可控性。该框架通过动态选择控制条件，优化图像生成，实验结果显示其在可控性、图像质量和文本对齐方面表现优异。

超越ControlNet++！腾讯优图提出动态条件选择新架构

量子位 ·

本文探讨了文本到图像生成模型的进展，提出了提高生成图像可控性和质量的方法，包括频域滤波器、语义扩散引导框架和自适应滤波器等技术。同时回顾了图像编辑技术及其在医学图像翻译中的应用，强调了源图像注入方案和未来研究方向。

可变频率扩散模型用于多功能文本引导的图像至图像翻译

BriefGPT - AI 论文速递 ·

本文介绍了多个先进的人类图像生成框架，如CapHuman、Text2Human和UnitedHuman。这些框架通过不同方法实现高质量、逼真的人像生成，具备姿态控制、细节调整和多样性，显著超越现有技术，且在生成图像的可控性和真实感方面表现优异。

从部件到整体：可控人体图像生成的统一参考框架

BriefGPT - AI 论文速递 ·