EmoBench: 评估大型语言模型的情绪智能
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
这项研究填补了情感研究中对认知评估的自动预测的空白,并使用CovidET-Appraisals数据集对Reddit帖子进行评估。结果显示,开源的大型语言模型在此任务中表现不佳,为情感智能模型的未来发展提出了新的挑战。
🎯
关键要点
- 情感研究中对认知评估的自动预测缺乏研究。
- 本研究提出了CovidET-Appraisals数据集,评估了241个Reddit帖子中的24个评估维度。
- CovidET-Appraisals是评估大型语言模型在自动评估和解释认知评估能力的理想平台。
- 研究结果显示,开源的大型语言模型在此任务中表现不佳,提出了情感智能模型发展的新挑战。
➡️