MAD Speech:语音声音多样性的度量

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种多模态方法(MADA)用于检测社交媒体上的滥用内容,并证明利用其他模态的判别信息对音频建模可以提高性能。同时,实验证明了潜在情绪和虐待行为之间的相关性。

🎯

关键要点

  • 提出了一种多模态方法(MADA)用于检测社交媒体上的滥用内容。
  • MADA利用其他模态的判别信息对音频建模,提高了性能。
  • 在ADIMA数据集上,MADA的表现优于仅使用音频的方法。
  • 在测试10种不同语言后,多模态结合可获得0.6%-5.2%的一致增益。
  • 实验证明潜在情绪与虐待行为之间存在强烈相关性。
➡️

继续阅读