本研究探讨了现代人工智能在情感推理方面的能力,发现基础模型在情感理解上表现出类人的能力,甚至超越了人类的判断。这些模型在情感及其对信念和行为的影响理解上取得了显著进展。
最近的研究发现,大型语言模型具有推理人们心理状态的能力。研究者通过使用视频和文本开发了一个基于多模态语言模型的推理管道,实现了对涉及社交和情感推理内容的视频的显性推理。同时,他们还揭示了多模态语言模型如何推理认知理论。
该研究探讨了GPT系列语言模型的情感推理能力,发现其在预测情感强度和应对反应方面存在困难,但在没有使用提示工程的情况下,其预测结果与人提供的评估和情感标签相一致。研究结果引发了如何有效利用这些模型的优点和解决其弱点的问题。
AffectVisDial是一个大规模数据集,包含50,000个10轮的视觉对话,用于测试在视觉对话中理解情感形成的能力。该数据集涉及基于对话的问答、情感预测和情感解释生成等三个技能。作者训练并展示了基于最先进模型的情感视觉对话基准,并指出其模型生成的回答显示了对视觉对话中情感推理能力有希望的结果。
完成下面两步后,将自动完成登录并继续当前操作。