BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 -

MAD Speech:语音声音多样性的度量

发展了一种声学多样性的轻量级度量标准集,通过专门的嵌入模型和一个聚合函数来衡量声学多样性,在多个真实评估场景中展示了其适用性。

本文介绍了一种多模态方法(MADA)用于检测社交媒体上的滥用内容,并证明利用其他模态的判别信息对音频建模可以提高性能。同时,实验证明了潜在情绪和虐待行为之间的相关性。

多模态方法 滥用内容 潜在情绪 社交媒体 音频建模

相关推荐 去reddit讨论