评估计算机视觉模型的社会技术视角:基于性别和情绪检测与推理的案例研究
原文中文,约600字,阅读约需2分钟。发表于: 。在计算机视觉技术的不断发展中,图像中性别和情绪的自动检测和解释是一个重要的研究领域。本文调查了计算机视觉模型中的社会偏见,并强调传统评估指标如精确度、召回率和准确率的局限性。我们的研究提出了一个社会技术框架,用于评估计算机视觉模型,同时结合了技术性能指标和社会公平考虑。我们使用一个包含 5,570 张与疫苗接种和气候变化相关的图像的数据集,对比了各种计算机视觉模型的性能,包括传统模型如...
本研究调查了计算机视觉模型中的性别和情绪自动检测的社会偏见,并提出了社会技术框架来评估模型的性能和公平性。研究发现GPT-4 Vision在性别分类方面准确性高,但存在对跨性别和非二元人格的歧视性偏见。此外,情绪检测也存在偏见。研究强调了开发全面评估标准的必要性,以解决计算机视觉模型中的有效性和歧视性偏见。