2023 年 ICON 共享任务概述:印度语中性别虐待检测
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
在线性别暴力与互联网和社交媒体的采用同时增长。本文介绍了一个关于三种语言中性别虐待的数据集,展示了一种参与性的方法来创建推动 AI 系统的数据集。
🎯
关键要点
-
在线性别暴力与互联网和社交媒体的采用同时增长。
-
性别暴力在全球多数国家尤其严重,尤其是非英语社交媒体用户。
-
需要自动检测仇恨言论,特别是性别虐待,但缺乏特定语言和语境的数据。
-
本文介绍了一个关于印地语、泰米尔语和印度英语的性别虐待数据集。
-
数据集由南亚的妇女或LGBTQIA群体成员的专家标注的推文组成。
-
数据集涉及性别虐待经历的三个问题,展示了一种参与性的方法来创建AI系统的数据集。
➡️