Tox-BART:利用毒性属性生成隐含仇恨言论的解释

📝

内容提要

利用语言模型为隐藏的仇恨帖子生成解释是一个活跃的研究领域,解释的目的是明确潜在的刻板印象并帮助内容管理员。研究通常结合前 k 个相关的知识图谱 (KG) 元组来提供世界知识并改善标准指标的性能,但我们的研究提出了冲突的证据,认为 KG 元组的质量在生成隐含解释方面的作用不明确。因此,将外部毒性信号纳入的简化模型优于 KG 融合模型。在...

➡️

继续阅读