本研究提出了一种名为EZIGen的新方法,用于解决零-shot主题驱动图像生成中的身份保护与文本对齐之间的平衡问题。该方法通过设计基于UNet架构的主题图像编码器,并生成初始布局,实现了有效的身份保持与文本对齐。在多个基准测试中取得了最新的效果,并显著减少了训练数据需求。
完成下面两步后,将自动完成登录并继续当前操作。