MAD Speech:语音声音多样性的度量
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种多模态方法(MADA)用于检测社交媒体上的滥用内容,并证明利用其他模态的判别信息对音频建模可以提高性能。同时,实验证明了潜在情绪和虐待行为之间的相关性。
🎯
关键要点
- 提出了一种多模态方法(MADA)用于检测社交媒体上的滥用内容。
- MADA利用其他模态的判别信息对音频建模,提高了性能。
- 在ADIMA数据集上,MADA的表现优于仅使用音频的方法。
- 在测试10种不同语言后,多模态结合可获得0.6%-5.2%的一致增益。
- 实验证明潜在情绪与虐待行为之间存在强烈相关性。
➡️