本文介绍了一种名为PB&J的框架,通过引入用户判断背后的潜在理由,改善语言模型的人物角色。该方法结合心理学理论,如五大人格特质,生成更准确的用户偏好预测。实验结果表明,PB&J框架在公共舆论和电影偏好预测任务中表现优于仅依赖用户人口统计信息的模型,并且与人类撰写的理由相当,显示出合成理由的潜力。
本文探讨了大型语言模型(LLMs)中的社会偏见,提出了一种基于相对偏见分析的新模型。研究显示,LLMs在性别、社会阶级和性取向等方面存在显著偏见,并且不同模型在政治立场分类任务中的表现存在差异。通过心理学理论,分析了显性与隐性偏见的机制,并提出了量化社会偏见的新策略,以深入理解其影响。
本文探讨了良好解释的定义、历史、现代AI的解释问题和挑战,以及领先心理学理论的发展。建议AI/XAI研究人员在研究报告中包含更多有关其经验或实验方法的详细信息,类似于实验心理学研究报告。
完成下面两步后,将自动完成登录并继续当前操作。