评估最佳参考翻译

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本研究提出了一套基于明示错误分析及 MQM 框架的机器翻译评估方法,并应用于 WMT 2020 挑战赛。评估结果显示,自动评估指标基于预训练嵌入的表现足以胜过人工众包评估,为今后的研究提供公共语料库。

🎯

关键要点

  • 研究机器翻译质量评估的难点在于缺乏标准程序及评估方法的计量问题。
  • 本研究提出一套基于明示错误分析及 MQM 框架的评估方法。
  • 该评估方法应用于 WMT 2020 挑战赛的两个语言对中。
  • 评估结果显示,人工翻译的结果被明显偏爱。
  • 自动评估指标基于预训练嵌入的表现足以胜过人工众包评估。
  • 研究为今后的研究提供了公共语料库。
➡️

继续阅读