BriefGPT - AI 论文速递 ·

MaCmS：用于情感分析的马加希混码数据集

💡 原文中文，约1200字，阅读约需3分钟。

📝

内容提要

本文介绍了针对印地语、孟加拉语和马拉雅拉姆语与英语混合文本的情感分析研究，提出了新的语料库和模型，旨在提高情感分析的准确性和效率。研究涵盖混合语句生成算法、情感分类和讽刺检测等方面，展示了先进技术和评估结果。

🎯

❓

MaCmS是一个用于情感分析的马加希混码数据集，旨在提高多语言混合文本的情感分析准确性和效率。

研究提出了基于字符三元组LSTM模型和基于词元素的多项式朴素贝叶斯模型的集成模型。

SentMix-3L数据集包含孟加拉语、英语和印地语的代码混合情感分析数据，并通过评估显示GPT-3.5的表现优于其他模型。

SACMT方法通过对比学习将混合代码和标准语言的句子映射到共同的情感空间，提升了情感分析的准确度。

研究使用了Code Mixing Index（CMI）和Degree of Code Mixing（DCM）指标来评估生成的混合文本。

研究开发了一个多模态的印地语 - 英语混合数据集，并提出了基于注意力机制的神经架构MSH-COMICS用于讽刺检测和幽默分类。

🏷️