CCAE:源自中国的亚洲英语语料库
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该文介绍了一个名为CORGI-PM的高质量标注语料库,用于在中文语境下进行性别偏见标注,其中包含32.9k个句子。作者们解决了文本性别偏见的自动去除中面临的三个挑战,即检测、分类和去除。这是首个用于性别偏见探测和去除的中文语境句子级语料库。
🎯
关键要点
- 介绍了高质量标注语料库CORGI-PM,用于中文性别偏见标注。
- CORGI-PM包含32.9k个句子。
- 解决了文本性别偏见自动去除的三个挑战:检测、分类和去除。
- 这是首个用于性别偏见探测和去除的中文句子级语料库。
➡️