本文介绍了一种名为PB&J的框架,通过引入用户判断背后的潜在理由,改善语言模型的人物角色。该方法结合心理学理论,如五大人格特质,生成更准确的用户偏好预测。实验结果表明,PB&J框架在公共舆论和电影偏好预测任务中表现优于仅依赖用户人口统计信息的模型,并且与人类撰写的理由相当,显示出合成理由的潜力。
最近的研究发现,预训练的大型语言模型(LLMs)具有类似于人类认知结构的特点。研究人员通过调查LLMs中的社会偏见现象,发现了一个并行现象,即“重新判断不一致”。这一发现可能意味着随着LLMs能力的增强,不同的认知结构也会出现。利用心理学理论可以深入了解LLMs中显性和隐性结构的表达机制。
本文探讨了良好解释的定义、历史、现代AI的解释问题和挑战,以及领先心理学理论的发展。建议AI/XAI研究人员在研究报告中包含更多有关其经验或实验方法的详细信息,类似于实验心理学研究报告。
完成下面两步后,将自动完成登录并继续当前操作。