本文介绍了作者在构建Go测试模块时创建的两个新包:goldy和must。goldy通过黄金文件存储预期输出,简化复杂字符串的测试;must则通过处理错误简化测试设置,提高代码可读性。这两个工具旨在提升测试代码的整洁性和可维护性。
本文总结了对WMT-2023测试套件的评估结果,重点关注翻译系统在翻译女性和男性性别以及生成性别包容性翻译的能力。结果显示,所有评估的机器翻译模型在生成具有包容性的语言形式方面都面临挑战。
完成下面两步后,将自动完成登录并继续当前操作。