Efficient and Explainable Hate Speech Detection Based on Model Distillation

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种基于模型蒸馏的仇恨言论检测方法,解决了现有模型的可解释性问题。通过链式思维提取解释,蒸馏后的模型在分类性能上超过大型模型,为仇恨言论检测的经济性和可行性做出了贡献。

🎯

关键要点

  • 本研究提出了一种基于模型蒸馏的仇恨言论检测方法,解决了现有模型的可解释性问题。

  • 通过链式思维提取解释,蒸馏后的模型在分类性能上超过大型模型。

  • 该方法为仇恨言论检测的经济性和可行性做出了贡献。

  • 自动检测仇恨和辱骂语言对于对抗其在线传播至关重要。

➡️

继续阅读