该研究解决了机器翻译系统中的性别歧视问题,提出了一种生成语法正确的性别化翻译替代方案的解决方案。作者开源了五种语言对的训练和测试数据集,并建立了基准。该解决方案与标准机器翻译模型无缝集成,无需额外组件或增加推理开销。
印度司法体系的法律文本大部分以复杂的英语编写,但只有约10%的印度人能读懂英语。本研究构建了第一个高质量的法律平行语料库,包含英语和九种印度语言的对齐文本单元。对该语料库上的机器翻译系统进行了性能评估,并通过调查法律从业人员了解他们对机器翻译系统的满意度。
本文介绍了错误跨度标注(ESA)作为一种人工评估协议,将直接评估与多维度质量度量相结合。通过与机器翻译系统和人工参考翻译的比较,验证了ESA的有效性。结果显示ESA比MQM更快且更便宜,无需昂贵的MQM专家。
OTTAWA是一种基于Optimal Transport的单词对齐器,用于增强机器翻译系统的检测能力。在HalOmi基准测试中,OTTAWA取得了竞争性的结果,并具有识别错误类型和进行单词级检测的能力。
GEST是一个新的数据集,用于评估掩码语言模型和机器翻译系统中的性别刻板推理。该数据集包含16个关于男性和女性的性别刻板印象的样本,适用于9种斯拉夫语言和英语。通过使用GEST评估了11个掩码语言模型和4个机器翻译系统,发现几乎所有评估模型和语言中都存在显著和一致数量的刻板推理。
完成下面两步后,将自动完成登录并继续当前操作。