BriefGPT - AI 论文速递 ·

潜在方向：生成式人工智能中的偏见缓解简单路径

💡 原文中文，约1700字，阅读约需4分钟。

📝

内容提要

本文提出了一种新方法，通过自监督学习和公平扩散策略，减少图像生成中的性别和种族偏见，支持多样化公平性。同时介绍了安全潜在扩散（SLD）技术，有效过滤不当图像提示，提升生成质量。

🎯

❓

通过自监督学习和公平扩散策略，可以在没有偏见的情况下指导生成模型的公平性，减少性别和种族偏见。

安全潜在扩散（SLD）技术是一种图像噪声过滤方法，能够在扩散过程中去除不当图像提示，提升生成质量，无需额外培训。

公平扩散策略无需数据筛选和额外培训，能够有效指导生成模型的公平性，防止加重偏见。

研究表明视觉-语言模型存在社会偏见和刻板印象，需要通过去偏方法来弥补多模式伤害。

通过实验结果显示，使用分布对齐损失和有偏直接微调技术显著降低生成图像中的性别和种族偏见。

该方法具有可扩展性，可以通过将提示包含在微调数据中，同时消除多个概念的偏见，支持多样化公平性。

🏷️