BAN-PL: Wykop.pl 网络服务禁止的有害和冒犯性内容的新波兰数据集
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文介绍了生成式仇恨言论干预任务和两个全标记的大规模仇恨言论干预数据集。数据集包括对话段、仇恨言论标签和干预响应。分析了数据集中的干预策略,并探索了自动响应生成方法的性能。
🎯
关键要点
- 提出了一项生成式仇恨言论干预的新任务。
- 介绍了从 Gab 和 Reddit 收集的两个全标记的大规模仇恨言论干预数据集。
- 数据集包括对话段、仇恨言论标签和 MTurk Workers 编写的干预响应。
- 分析了数据集中的常见干预策略。
- 探索了自动响应生成方法在新数据集上的性能,以提供未来研究的基准。
➡️