MuTox:通用多语种基于音频的毒性数据集和零样本检测器
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
通过创建MuTox音频数据集,实现了跨多语言的零射击毒性检测,AUC值提高超过1%,语言覆盖范围扩大10倍以上。与基于文本的分类器相比,MuTox的精确度和召回率提高约2.5倍,显示出其在音频毒性检测领域的潜力。
🎯
关键要点
-
通过创建MuTox音频数据集,实现了跨多语言的零射击毒性检测。
-
MuTox的AUC值提高超过1%。
-
语言覆盖范围扩大10倍以上。
-
与基于文本的分类器相比,MuTox的精确度和召回率提高约2.5倍。
-
MuTox在音频毒性检测领域显示出显著的潜力。
➡️