GradBias:揭示文本到图像生成模型中的词语影响偏见
原文中文,约200字,阅读约需1分钟。发表于: 。本研究解决了现有偏见检测方法仅关注预定义偏见集的问题,提出了一种新颖的开放集偏见识别和量化框架。研究发现,文本提示中的中性词对生成图像中的偏见具有显著影响,且比多种基线模型表现更优。
研究发现社会属性影响有害内容和评分,探讨减缓偏见策略。
本研究解决了现有偏见检测方法仅关注预定义偏见集的问题,提出了一种新颖的开放集偏见识别和量化框架。研究发现,文本提示中的中性词对生成图像中的偏见具有显著影响,且比多种基线模型表现更优。
研究发现社会属性影响有害内容和评分,探讨减缓偏见策略。