孟加拉语的背景长度变化特征的实证研究

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

IndiBias是一个包含800个句子和偏见测量元组的数据集,用于评估印度社会偏见。研究发现,通过使用IndiBias,语言模型在多个偏见测量指标上表现出更多偏见。

🎯

关键要点

  • IndiBias是一个评估印度社会偏见的基准数据集。
  • 该数据集包含800个句子和偏见测量元组,提供英语和印地语版本。
  • IndiBias通过过滤和翻译CrowS-Pairs数据集而成,增加了印度特有的社会偏见维度。
  • 数据集还针对交叉偏见构建了相应的资源。
  • 研究比较了十种不同的语言模型,发现它们在多个偏见测量指标上表现出更多偏见。
➡️

继续阅读