TartuNLP 参与 EvaLatin 2024: 情感极性检测
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了一种基于情感分析的新数据集和实验结果。实验发现,在议会数据上进行额外预训练可以显著提高模型性能,特别是在情感检测任务上。多语言模型在未知语言上表现良好,并且其他语言的额外数据可以提高目标议会的结果。该研究对社会科学做出了重要贡献,结合计算机科学和计算语言学,建立了一种可靠的政治文本情感分析方法。
🎯
关键要点
- 本文介绍了一种基于情感分析的新数据集和实验结果。
- 研究重点是训练一个强大的情感分类器用于议会会议。
- 引入了第一个领域特定的语言模型(LLM)用于政治科学应用。
- 在27个欧洲议会的会议记录中进行了1.72亿专业领域词汇的预训练。
- 实验证明,LLM在议会数据上的额外预训练显著提高模型性能,尤其是在情感检测任务上。
- 多语言模型在未知语言上表现良好,其他语言的额外数据提高了目标议会的结果。
- 该研究对社会科学多个领域做出了重要贡献,结合计算机科学和计算语言学。
- 建立了一种更可靠的政治文本情感分析方法,支持学者使用标准化工具和技术研究政治情感。
➡️