Unveiling the Capabilities of Large Language Models in Detecting Offensive Language and Annotation Disagreement
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究探讨大型语言模型(LLMs)在检测冒犯性语言时的人类注释分歧问题。研究发现,LLMs对注释分歧样本的信心与人类一致性相关,这些分歧影响模型决策,为改进冒犯性语言检测提供了指导。
🎯
关键要点
-
本研究探讨大型语言模型(LLMs)在检测冒犯性语言时的人类注释分歧问题。
-
研究发现,LLMs对注释分歧样本的信心与人类注释员的一致性相关。
-
注释分歧影响模型的决策,提供了改进冒犯性语言检测的指导。
➡️