BriefGPT - AI 论文速递 ·

公平队列：重新思考公平文本到图像生成的提示学习

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

本文介绍了一种名为公平扩散的策略，通过Prompt-Free Diffusion框架实现无偏见的图像生成。该框架利用语义上下文编码器，基于视觉输入生成新图像，并提出动态提示学习方法，优化图像编辑，解决文本到图像模型的偏见问题，提高生成图像的质量和多样性。

🎯

🔎

公平扩散策略通过无偏见的图像生成，解决了传统文本到图像模型中的偏见问题。这一方法不仅提升了生成图像的质量和多样性，还为创意AI应用提供了新的可能性，尤其是在需要避免刻板印象的场景中。

动态提示学习(DPL)方法在图像编辑中展现出显著优势，尤其是在复杂场景下的提示编辑。通过精细控制特定对象的编辑，DPL有效防止了对其他区域的意外更改，提升了用户在图像生成过程中的体验和结果的准确性。

软提示的引入使得文本到图像生成模型能够在更抽象的层面上进行个性化。这种方法不仅允许从参考图像中提取共性，还能创造出具有变化的新实例，增强了生成模型的灵活性和适应性，适用于多种创意任务。

❓

公平扩散策略的核心框架是Prompt-Free Diffusion，利用语义上下文编码器(SeeCoder)生成新图像，无需文本提示。

动态提示学习(DPL)方法用于图像编辑，能够修复交叉注意力图，防止对其他图像区域的意外更改。

通过提出公平映射方法，修改预训练的文本到图像模型，以控制提示语，从而解决生成有偏见图像的问题。

PromptCharm系统支持用户在生成图像和优化过程中，提供可视化模型注意力值以提高生成图像的质量。

公平扩散策略通过优化图像编辑和使用软提示个性化模型，允许从参考图像中借鉴共性，创造新实例，从而提高生成图像的质量和多样性。

在线提示优化框架旨在优化推断过程，以生成高质量的少数实例，为数据增强和创意AI应用提供新可能性。

🏷️