文本到图像合成的语义感知数据增强
原文中文,约300字,阅读约需1分钟。发表于: 。通过语义感知数据增强 (SADA) 框架来提升文本到图像合成 (T2Isyn) 模型中的文本 - 图像一致性并改善图像质量。该框架通过隐式文本语义保持增强 (ITA) 在语义空间中扩充文本,并结合特定设计的图像语义正则化损失 (Lr) 作为生成图像的语义保持,以解决语义不匹配和坍塌问题。大量实验证实了 SADA 在各种模型中提升了文本 - 图像一致性和图像质量,特别是在 Stable...
通过SADA框架提升T2Isyn模型的文本-图像一致性和图像质量。SADA使用ITA扩充文本的语义空间,并使用Lr作为生成图像的语义保持。实验证实SADA在各种模型中提升了文本-图像一致性和图像质量。