EmoBench: 评估大型语言模型的情绪智能

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

这项研究填补了情感研究中对认知评估的自动预测的空白,并使用CovidET-Appraisals数据集对Reddit帖子进行评估。结果显示,开源的大型语言模型在此任务中表现不佳,为情感智能模型的未来发展提出了新的挑战。

🎯

关键要点

  • 情感研究中对认知评估的自动预测缺乏研究。
  • 本研究提出了CovidET-Appraisals数据集,评估了241个Reddit帖子中的24个评估维度。
  • CovidET-Appraisals是评估大型语言模型在自动评估和解释认知评估能力的理想平台。
  • 研究结果显示,开源的大型语言模型在此任务中表现不佳,提出了情感智能模型发展的新挑战。
➡️

继续阅读