可解释的音频仇恨言论检测研究
原文中文,约300字,阅读约需1分钟。发表于: 。本研究探讨了音频仇恨言论检测领域的解释能力缺失,提出了可解释的音频仇恨言论检测任务,通过识别音频帧级别的证据来进行分类。研究发现,端到端方法在检测准确性上优于级联方法,并且音频帧级别的合理性明显提升了检测效果。
本研究提出了名为HateDebias的基准测试,用于分析仇恨言论检测模型的能力。通过重新组织数据集以适应连续学习的设置,并提出去偏见框架和记忆重播策略,实验结果表明该方法可以提高基线模型的效果。
本研究探讨了音频仇恨言论检测领域的解释能力缺失,提出了可解释的音频仇恨言论检测任务,通过识别音频帧级别的证据来进行分类。研究发现,端到端方法在检测准确性上优于级联方法,并且音频帧级别的合理性明显提升了检测效果。
本研究提出了名为HateDebias的基准测试,用于分析仇恨言论检测模型的能力。通过重新组织数据集以适应连续学习的设置,并提出去偏见框架和记忆重播策略,实验结果表明该方法可以提高基线模型的效果。