测试套件任务:使用 MuST-SHE 和 INES 评估机器翻译的性别公平性
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文总结了对WMT-2023测试套件的评估结果,重点关注翻译系统在翻译女性和男性性别以及生成性别包容性翻译的能力。结果显示,所有评估的机器翻译模型在生成具有包容性的语言形式方面都面临挑战。
🎯
关键要点
- 本文总结了WMT-2023测试套件的评估结果。
- 重点关注MuST-SHE-WMT23和INES两个测试套件。
- 研究了en-de和de-en语言对的翻译系统能力。
- 探讨了翻译女性和男性性别的能力。
- 讨论了生成性别包容性翻译的挑战。
- 系统在翻译自然性别现象中的表现合理且可比较。
- 所有评估的机器翻译模型在生成包容性语言方面面临挑战。
- 表明该领域有待进一步改进和研究。
➡️