2023 年 ICON 共享任务概述:印度语中性别虐待检测

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

在线性别暴力与互联网和社交媒体的采用同时增长。本文介绍了一个关于三种语言中性别虐待的数据集,展示了一种参与性的方法来创建推动 AI 系统的数据集。

🎯

关键要点

  • 在线性别暴力与互联网和社交媒体的采用同时增长。

  • 性别暴力在全球多数国家尤其严重,尤其是非英语社交媒体用户。

  • 需要自动检测仇恨言论,特别是性别虐待,但缺乏特定语言和语境的数据。

  • 本文介绍了一个关于印地语、泰米尔语和印度英语的性别虐待数据集。

  • 数据集由南亚的妇女或LGBTQIA群体成员的专家标注的推文组成。

  • 数据集涉及性别虐待经历的三个问题,展示了一种参与性的方法来创建AI系统的数据集。

➡️

继续阅读