基于优化的多模态语义图像编辑
原文中文,约200字,阅读约需1分钟。发表于: 。我们提出了一种推理时间编辑优化方法,旨在通过两个专门的损失函数,成功地完成本地图像修改和全局内容一致性保留的竞争子任务,实现文本、姿势和涂鸦等多种编辑指令类型的灵活编辑解决方案,并通过定性和定量实验证明了我们能够实现复杂的编辑。
本文介绍了一种利用Image Information Removal模块去除图像中与颜色和纹理相关的信息的方法,以实现文本到图像编辑。该方法在三个基准数据集上达到了可编辑性和保真度的平衡,并且编辑后的图像比之前的艺术作品更受欢迎。