CCAE:源自中国的亚洲英语语料库

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该文介绍了一个名为CORGI-PM的高质量标注语料库,用于在中文语境下进行性别偏见标注,其中包含32.9k个句子。作者们解决了文本性别偏见的自动去除中面临的三个挑战,即检测、分类和去除。这是首个用于性别偏见探测和去除的中文语境句子级语料库。

🎯

关键要点

  • 介绍了高质量标注语料库CORGI-PM,用于中文性别偏见标注。
  • CORGI-PM包含32.9k个句子。
  • 解决了文本性别偏见自动去除的三个挑战:检测、分类和去除。
  • 这是首个用于性别偏见探测和去除的中文句子级语料库。
➡️

继续阅读