小红花·文摘

Apple Machine Learning Research ·

本文探讨了大型语言模型（LLMs）中的社会偏见，提出了一种基于相对偏见分析的新模型。研究显示，LLMs在性别、社会阶级和性取向等方面存在显著偏见，并且不同模型在政治立场分类任务中的表现存在差异。通过心理学理论，分析了显性与隐性偏见的机制，并提出了量化社会偏见的新策略，以深入理解其影响。

BriefGPT - AI 论文速递 ·

本文探讨了良好解释的定义、历史、现代AI的解释问题和挑战，以及领先心理学理论的发展。建议AI/XAI研究人员在研究报告中包含更多有关其经验或实验方法的详细信息，类似于实验心理学研究报告。

BriefGPT - AI 论文速递 ·