文本到图像生成中强语义绑定的文本令牌嵌入几何性质研究

📝

内容提要

本文研究了复杂场景中文本图像对齐的问题,并提出了一种新的方法以改善文本到图像生成模型的语义绑定。通过分析文本令牌嵌入的几何性质,提出了无训练的文本嵌入感知框架TeeMo,有效提升了多对象和属性场景下的图像生成性能,实验结果显示其优于现有技术。

➡️

继续阅读