CosmicMan:一种用于人类的文本到图像基础模型

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

Text2Human是一个控制性框架,用于生成高质量和多样化的人类图像。它通过建立纹理感知码书和使用混合专家的扩散变换采样器来实现。

🎯

关键要点

  • 提出了一种名为 Text2Human 的控制性框架。

  • 该框架用于基于文本生成高质量和多样化的人类图像。

  • 建立了一个分层的纹理感知码书,存储不同类型纹理的多尺度神经表征。

  • 使用混合专家的扩散变换采样器采样码书中的索引。

  • 通过细粒度文本输入,生成的图像质量更高,更多样化,性能优于现有方法。

➡️

继续阅读