MASIVE: 英语和西班牙语的开放式情感状态识别
原文中文,约500字,阅读约需1分钟。发表于: 。情感分析中,很多自然语言处理研究都集中于识别少量离散情感类别,但这些基本集合很少考虑到文本数据,并且文化、语言和方言可以影响特定情感的解释。本研究将范围扩展到包括人类用来描述自己感受经历的无限多的情感状态集合,并收集并发布了包含超过 1000 个独特情感状态的英语和西班牙语 Reddit 帖子数据集 MASIVE。然后,将extit {情感状态识别}...
这项研究扩展了情感分析的范围,收集并发布了包含超过1000个独特情感状态的Reddit帖子数据集MASIVE。研究发现较小的多语言模型在情感状态识别任务中表现更好,甚至对于区域特定的西班牙语情感状态也是如此。预训练模型在MASIVE上的性能也得到了提高。本族语为母语的数据对于任务性能至关重要。