MuTox:通用多语种基于音频的毒性数据集和零样本检测器

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

通过创建MuTox音频数据集,实现了跨多语言的零射击毒性检测,AUC值提高超过1%,语言覆盖范围扩大10倍以上。与基于文本的分类器相比,MuTox的精确度和召回率提高约2.5倍,显示出其在音频毒性检测领域的潜力。

🎯

关键要点

  • 通过创建MuTox音频数据集,实现了跨多语言的零射击毒性检测。
  • MuTox的AUC值提高超过1%。
  • 语言覆盖范围扩大10倍以上。
  • 与基于文本的分类器相比,MuTox的精确度和召回率提高约2.5倍。
  • MuTox在音频毒性检测领域显示出显著的潜力。
➡️

继续阅读