孟加拉语的背景长度变化特征的实证研究
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
IndiBias是一个包含800个句子和偏见测量元组的数据集,用于评估印度社会偏见。研究发现,通过使用IndiBias,语言模型在多个偏见测量指标上表现出更多偏见。
🎯
关键要点
- IndiBias是一个评估印度社会偏见的基准数据集。
- 该数据集包含800个句子和偏见测量元组,提供英语和印地语版本。
- IndiBias通过过滤和翻译CrowS-Pairs数据集而成,增加了印度特有的社会偏见维度。
- 数据集还针对交叉偏见构建了相应的资源。
- 研究比较了十种不同的语言模型,发现它们在多个偏见测量指标上表现出更多偏见。
➡️