本文介绍了作者在WASSA 2023共享任务中使用BERT模型和多任务框架的方法,获得了感同身受和痛苦检测子任务的第三名。研究探讨了情感评分和共情分类,利用深度学习和机器学习技术取得了良好成绩。
本研究通过与人类基准对比的方式,综合评估了四个最先进的大型语言模型(GPT-4、LLaMA-2、Mixtral-8x7B 和 Gemini-Pro)在共 2000 个情感对话提示中的回应中的移情能力。我们的发现显示,大型语言模型在移情回应能力上显著超过人类,其中 GPT-4 的回应被评为 “好” 的比例比人类基准提高了约...
完成下面两步后,将自动完成登录并继续当前操作。