该研究解决了机器翻译系统中的性别歧视问题,提出了一种生成语法正确的性别化翻译替代方案的解决方案。作者开源了五种语言对的训练和测试数据集,并建立了基准。该解决方案与标准机器翻译模型无缝集成,无需额外组件或增加推理开销。
GEST是一个新的数据集,用于评估掩码语言模型和机器翻译系统中的性别刻板推理。该数据集包含16个关于男性和女性的性别刻板印象的样本,适用于9种斯拉夫语言和英语。通过使用GEST评估了11个掩码语言模型和4个机器翻译系统,发现几乎所有评估模型和语言中都存在显著和一致数量的刻板推理。
完成下面两步后,将自动完成登录并继续当前操作。