GradBias:揭示文本到图像生成模型中的词语影响偏见
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
研究发现社会属性影响有害内容和评分,探讨减缓偏见策略。
🎯
关键要点
- 社会属性如种族、性别和形象特征影响生成的有害内容。
- 社会属性影响能力相关词汇和有害刻板印象。
- 被描述个体的评分受到社会属性的显著影响。
- 探讨了大规模视觉-语言模型与语言模型之间的社会偏见关系。
- 研究提出了减缓偏见的推理策略。
🏷️
标签
➡️