融入人类解释的鲁棒仇恨言论检测

📝

内容提要

本研究旨在解决大型变换器语言模型在仇恨言论检测中的可推广性和鲁棒性问题。通过设计一种新的任务“刻板印象意图蕴涵(SIE)”,增强模型对刻板印象的上下文理解,研究发现SIE目标有助于提高内容理解,但在建模隐含意图方面仍面临挑战。

➡️

继续阅读