Efficient and Explainable Hate Speech Detection Based on Model Distillation
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种基于模型蒸馏的仇恨言论检测方法,解决了现有模型的可解释性问题。通过链式思维提取解释,蒸馏后的模型在分类性能上超过大型模型,为仇恨言论检测的经济性和可行性做出了贡献。
🎯
关键要点
-
本研究提出了一种基于模型蒸馏的仇恨言论检测方法,解决了现有模型的可解释性问题。
-
通过链式思维提取解释,蒸馏后的模型在分类性能上超过大型模型。
-
该方法为仇恨言论检测的经济性和可行性做出了贡献。
-
自动检测仇恨和辱骂语言对于对抗其在线传播至关重要。
➡️