本研究探讨了CLIP框架下视觉语言模型的社会偏差与预训练特征及下游表现的关系。结果表明,预训练数据集是偏差的重要预测因素,而模型架构的影响较小。内在偏差与下游表现呈正相关,优化模型可能加剧偏差,为减少偏差提供了启示。
完成下面两步后,将自动完成登录并继续当前操作。