小红花·文摘

本文提出了一种新方法——多模式复合关联分数（MCAS），用于测量多模式生成模型中的性别偏见。研究发现DALL-E 2和Stable Diffusion等模型存在性别和种族偏见，并提出了分布对齐损失和有偏直接微调等技术以降低这些偏见。研究强调了解决生成模型偏见的紧迫性，并提供了评估协议以分析性别指示对生成图像的影响。

生成偏见：审计文本到图像生成模型的内部偏见动态

BriefGPT - AI 论文速递 ·

DALL-E 2是一种将文本转化为图像的AI系统，展示出令人印象深刻的创造力和对色彩和构图的掌控。与其他现代系统相比，如Midjourney v6，它能产生详细逼真的图像，但缺乏同样程度的创造力和多样性。这种差异可能归因于训练数据集和偏好调整等因素。人类倾向于喜欢明亮和详细的图像，导致模型产生超详细和超丰富色彩的输出。通过强化学习等偏好调整方法，在模型的输出空间中创建吸引子，从而产生有偏差的输出。为了克服这些限制，正在探索一种新的范式，即直接操纵模型内部特征空间中的概念，以实现更多的控制和多样性。