CosmicMan:一种用于人类的文本到图像基础模型
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
Text2Human是一个控制性框架,用于生成高质量和多样化的人类图像。它通过建立纹理感知码书和使用混合专家的扩散变换采样器来实现。
🎯
关键要点
-
提出了一种名为 Text2Human 的控制性框架。
-
该框架用于基于文本生成高质量和多样化的人类图像。
-
建立了一个分层的纹理感知码书,存储不同类型纹理的多尺度神经表征。
-
使用混合专家的扩散变换采样器采样码书中的索引。
-
通过细粒度文本输入,生成的图像质量更高,更多样化,性能优于现有方法。
🏷️
标签
➡️