MuTox:通用多语种基于音频的毒性数据集和零样本检测器
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
通过创建MuTox音频数据集,实现了跨多语言的零射击毒性检测,AUC值提高超过1%,语言覆盖范围扩大10倍以上。与基于文本的分类器相比,MuTox的精确度和召回率提高约2.5倍,显示出其在音频毒性检测领域的潜力。
🎯
关键要点
- 通过创建MuTox音频数据集,实现了跨多语言的零射击毒性检测。
- MuTox的AUC值提高超过1%。
- 语言覆盖范围扩大10倍以上。
- 与基于文本的分类器相比,MuTox的精确度和召回率提高约2.5倍。
- MuTox在音频毒性检测领域显示出显著的潜力。
➡️