文本分类研究的新方向:最大化有限数据下情感分类的性能
原文中文,约200字,阅读约需1分钟。发表于: 。本文讨论了基于有限训练数据进行文本分类的问题,并提出了一种基准数据集和优化方法,使用 SVM 方法对情感分析进行评分,分别达到 40.83% 和 51.28% 的 F1 分数。
PerSenT数据集是一个困难的实体情感分析数据集,提供段落级别的情感注释。使用BERT微调文档级表示不足以解决问题,对整个文档进行段落级别的决策和聚合也无效。数据集包含5.3k个文档和38k个段落,涵盖3.2k个独特实体。