2024 年 MSP-Podcast SER 挑战: Ventoux 多模自监督学习下的语音情绪识别
原文中文,约400字,阅读约需1分钟。发表于: 。本研究详细介绍了我们在 2024 年 MSP-Podcast 语音情感识别 (SER) 挑战赛中的参赛作品。我们专注于任务 1,该任务涉及使用 MSP-Podcast 数据集对八种情感状态进行分类。我们采用了一种集成模型的方法,每个模型都独立训练,然后使用支持向量机 (SVM) 分类器在评分层面上进行融合。我们采用了自监督学习 (Self-Supervised Learning, SSL)...
本研究介绍了2024年MSP-Podcast语音情感识别挑战赛中的参赛作品,使用支持向量机分类器对八种情感状态进行分类。通过自监督学习在不同模态上进行微调,提高了系统的准确分类能力,开发集上取得了0.35%的F1宏平均。