UnitedHuman: 多源数据驱动的高分辨率人体生成
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
Text2Human是一种控制性框架,用于生成高质量和多样化的人类图像。该框架使用分层的纹理感知码书和混合专家的扩散变换采样器来生成具有更高质量和多样性的图像。使用细粒度文本输入,该框架比现有方法具有更好的性能。
🎯
关键要点
-
提出了一种名为Text2Human的控制性框架
-
该框架用于基于文本生成高质量和多样化的人类图像
-
建立了分层的纹理感知码书,存储不同类型纹理的多尺度神经表征
-
使用混合专家的扩散变换采样器采样码书中的索引
-
通过细粒度文本输入,生成的图像质量更高,更多样化
-
Text2Human的性能优于现有方法
🏷️
标签
➡️